Gene Haur_1675 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1675
Symbol	lysS
ID	5733559
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	1940893
End bp	1942371
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	51%
IMG OID	641278814
Product	lysyl-tRNA synthetase
Protein accession	YP_001544446
Protein GI	159898199
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1190] Lysyl-tRNA synthetase (class II)
TIGRFAM ID	[TIGR00499] lysyl-tRNA synthetase, eukaryotic and non-spirochete bacterial

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.100386
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATTAA ACGATTTACA GCAAACACGC TATGGCAAGC TACAGGCGCT GCAAGCCGCT 
GGCATCGAGC CATATCCAGC CCGAGTGCCG CAACGCACTC ATACATTAAC CGCCGTGCGT 
GAGCAATTTT CGGCCCTGGT TGAGGCCAAT GCCACGGTAA CAATTATGGG GCGCTTGCGC 
CAACGTCGCG TTATGGGCAA ATCAGCGTTC GCCCATTTAA ATGATGATCA TGGCGCGTTT 
CAAATTTTCC TCAGCAAAGC CGATGTTGGC GATGAGCCAT TCAAGCATTT TGTTGATCTG 
ACTGATCTTG GCGATATTAT TGCGGTCACA GGCACGCTCT TTACGACCAA AATGGGCGAA 
CCAAGCGTAC ATGTCACCAG CTGGACGATG CTCAGCAAGG CGATCACGCC GCCACCCGAC 
AAACGCGAAG GTCAATTTAG CGACCAAGAA GCTCGCCAAC GCCAACGCTA TGTTGACTTA 
TCCGCCAATC CTGAAGTTCG CGAAATCTTC CGGATTCGCG CTCGTTTGAT CACGGCAATG 
CGGCGCTACC TCGATGAACG CGGCTTTTTG GAAGTTGAAA CGCCAGTATT GCAGGGGATT 
TATGGTGGCG CAGCGGCGCG ACCATTCACC ACCCATCATA ATCAATTGCA CCAAGATTTA 
TACCTGCGGA TCGCCACCGA GCTCTATTTG AAGCGCTTGA TCGTTGGCGG CTTCGATGGT 
GTGTATGAAA TTGGCAAAAA CTTCCGCAAC GAAGGCGTTG ATCGCACCCA TAACCCCGAA 
TTTACCATGA TCGAGGTCTA TCAAGCCTAC GGCGATTATG AATCGATTAT GCAATTAACC 
GAGGGCATGA TTCGCTTCGC TGCTGAGCAA ATTTTTAACA GCACCAGCAT CGAATACCAA 
GGGCATCAGA TCGAGCTTGG CGGTTCGTGG CAGCGCTTGA CCATGCGCGA TGCCATTTTT 
GAAAAAACCG GGGTTGATAT TCGCGAGTGC CGCGAATTTG ATACACTATG GGAAGCAATT 
GGCGAAGCTG GCCTGAAAAT TGAGCGCAAG CCAACCTGGG CCAAGCAAGT TGATGAGCTA 
TTTAGTGAGT TTGTTGAGCC TGAGTTGATT CAGCCAACCT TTATCACCGA ATACCCTCAG 
CCACTTTCGC CTTTGGCCAA GCGCAAAGCC GATGATCCAC AGTTTGTCGA GCGCTTTGAG 
CTATTTATGC TTGGAGCCGA AATTGCCAAC GCCTTCAGCG AATTAAACGA TCCCTTCGAT 
CAAGAGCAAC GCTTCTTGGA GCAAGGCCGC GATTATGCTG CTGGCGATGA CGAAGCCATG 
CAAATGGACG AAGATTACCT TGAGGCGCTT AAAGTTGGTA TGCCACCAAC TGGCGGTTTA 
GGCATCGGGA TCGATCGGCT ATGTCTGTTA TTTACCAATC AAACTACGAT TCGTGAAGTA 
ATCTTCTTCC CGCATTTGCG CAAGCAGGGC GAGGAGTAG

Protein sequence

MELNDLQQTR YGKLQALQAA GIEPYPARVP QRTHTLTAVR EQFSALVEAN ATVTIMGRLR 
QRRVMGKSAF AHLNDDHGAF QIFLSKADVG DEPFKHFVDL TDLGDIIAVT GTLFTTKMGE 
PSVHVTSWTM LSKAITPPPD KREGQFSDQE ARQRQRYVDL SANPEVREIF RIRARLITAM 
RRYLDERGFL EVETPVLQGI YGGAAARPFT THHNQLHQDL YLRIATELYL KRLIVGGFDG 
VYEIGKNFRN EGVDRTHNPE FTMIEVYQAY GDYESIMQLT EGMIRFAAEQ IFNSTSIEYQ 
GHQIELGGSW QRLTMRDAIF EKTGVDIREC REFDTLWEAI GEAGLKIERK PTWAKQVDEL 
FSEFVEPELI QPTFITEYPQ PLSPLAKRKA DDPQFVERFE LFMLGAEIAN AFSELNDPFD 
QEQRFLEQGR DYAAGDDEAM QMDEDYLEAL KVGMPPTGGL GIGIDRLCLL FTNQTTIREV 
IFFPHLRKQG EE