Gene Haur_3108 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3108
Symbol	cysS
ID	5734980
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	3921346
End bp	3922746
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	51%
IMG OID	641280252
Product	cysteinyl-tRNA synthetase
Protein accession	YP_001545874
Protein GI	159899627
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0215] Cysteinyl-tRNA synthetase
TIGRFAM ID	[TIGR00435] cysteinyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00597205
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCATTAG CAATTTACAA CACGCTTACC CGCCAGACCG AGCCGTTTAC ACCGTTGGTT 
GCTGACCATG TGTCGATGTA TGTCTGTGGG CCGACGGTGT ATTCTGATGC CCATATTGGT 
CATGCCATGT CAGCGGTGGT GTTCGATGTG GTGCGGCGCT ATTTGGAATG GTCGGGCTAT 
ACGGTGCGCC ATGTGATGAA TTTTACCGAT GTTGATGATA AAATTATTCG CCGCGCCAAC 
GAGCAAGGCC GTGATCCCAT GGAATTGGCC GAGAGCTATA CCTTGGCCTT TCTTGATCAA 
TTGGGCCAAT TGAATGTGCT GCCCGCTACG GCCTACCCCC GCGTTTCAAC CACGATTCCG 
CAAATTATTC AATTTATCGA AGGCTTGATT GCCAAAGATG CGGCATACCA CGCCAGCAAT 
GGCGATGTCT ATTTTCGGGT ACGAGCCGAC GAAGATTATG GCAAACTTTC GCGCCGCGCT 
GTCGATGATA TGCGCTCTGG TGCGCGAATT GCTCCCGATG AAGCCAAAGA TGACCCGTTA 
GATTTTGCGC TGTGGAAATC GGCCAAACCA GGCGAGCCAG CTTGGGAAAG CCCATGGGGT 
CAAGGCCGAC CTGGTTGGCA TATCGAATGC TCGGCCATGA GTTTGCACGA ATTAGCTGAG 
CAAATTGATA TTCATGGTGG TGGAAACGAC TTGATCTTCC CCCACCACGA AAATGAAATT 
GCCCAAACCG AATCATTAAC TGGCAAAAAT TTCGCCCAAG TCTGGATGCA CAATGGCATG 
CTGCAATTGG CTGGCGAGAA AATGAGCAAA TCGCTGGGCA ATTTGATCAC GATTGATCAA 
TTTTTAAGCG AACACTCCGC CGATATTATG CGCTTGCTGG TGCTTTCTGG CTCGTATCGT 
GCACCATTGG TTTATAATGA TGAGGTTTTG GCTGATACCC AACGCAAACT TGAGCGAATT 
ATGTCGGCGT TGAAACCAGC CCATGGCACG GCAACCAACG GCCCAGTCGT TGAGACGCTA 
AATGCAATTG TTGCCAAAGC CCCAGCCGAT TTCCGTGCCG CGATGGACAG CGATTTCAAT 
AGTGCAGCAG CCTTGGCGGT CTTGTTTGAT TTGGTGCGTT CGATCAACGC TGCCCGTGAT 
GCAGGCGTTG GTGGCGAGCC ATTCGCAGCA GGTCAAGCCC GTTTACGTGA ATTAGCTGCG 
GTGCTCGGCT TACGCTTAGA AGCGCCCAGC GCCAGCAAAA CCGATGCTGC ACCTTTTATC 
GAATTGTTGA TTGAGCTACG CGCCGAGTTG CGCAAAGCTA AACAATGGGC ACTCTCCGAT 
TTAGTACGCA ACCGCCTGAG CGAGCTTGAT GTACAACTCG AAGATAGTCC CAACGGCACA 
ACCTGGACGA CGAAAGGCTA A

Protein sequence

MALAIYNTLT RQTEPFTPLV ADHVSMYVCG PTVYSDAHIG HAMSAVVFDV VRRYLEWSGY 
TVRHVMNFTD VDDKIIRRAN EQGRDPMELA ESYTLAFLDQ LGQLNVLPAT AYPRVSTTIP 
QIIQFIEGLI AKDAAYHASN GDVYFRVRAD EDYGKLSRRA VDDMRSGARI APDEAKDDPL 
DFALWKSAKP GEPAWESPWG QGRPGWHIEC SAMSLHELAE QIDIHGGGND LIFPHHENEI 
AQTESLTGKN FAQVWMHNGM LQLAGEKMSK SLGNLITIDQ FLSEHSADIM RLLVLSGSYR 
APLVYNDEVL ADTQRKLERI MSALKPAHGT ATNGPVVETL NAIVAKAPAD FRAAMDSDFN 
SAAALAVLFD LVRSINAARD AGVGGEPFAA GQARLRELAA VLGLRLEAPS ASKTDAAPFI 
ELLIELRAEL RKAKQWALSD LVRNRLSELD VQLEDSPNGT TWTTKG