Gene Cag_0072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0072
Symbol
ID	3746406
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	79762
End bp	80826
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	49%
IMG OID	637772598
Product	tryptophanyl-tRNA synthetase
Protein accession	YP_378394
Protein GI	78188056
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0180] Tryptophanyl-tRNA synthetase
TIGRFAM ID	[TIGR00233] tryptophanyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAACAG CACGAATTTT AAGCGGCATG CGACCTACCG GCAAGCTCCA TCTTGGACAC 
TACACCGGTG CCCTTGAAAA TTGGGTTGCC CAACAAAATC AATGCTCTGC GGATGGCAAC 
CGCGCTTACG ACACCTATTT TCTGATTGCC GATTACCATA CCTTAACCAC CTCGCTTTCA 
ACCGATGACG TGTATGCTCA TTCGCTTGAT ATGCTGGTGG ATTGGCTTGC CGCTGGCATT 
GATCCCGAAA AAAGTCCTAT GTTTCGCCAA TCGCAGGTAA AGCAACATGC CGAGCTTTTT 
TTGCTTTTCT CTATGCTTAT TACCTCCGCA CGCTTGGAGC GCAATCCAAC GTTAAAAGAG 
CAAGTGCGCG ACCTTCATAT GGATTCAATG AGCTACGGGC ATCTTGGCTA TCCTGTTTTG 
CAATCAGCAG ATATTTTGCT CTACAAGGCA AACGTGGTGC CTGTTGGTGA GGATCAAATT 
CCCCATGTGG AAATTACCCG CGAAATTGCT CGCAAGTTTA ACAACCACTT TCCTCATCCG 
CTTTACGGCA ACGTCTTTGC TGAACCTGAA CCAAAAATCA CCAAATTTGC ACGCCTTGCA 
GGGCTTGACG GAAAAGCAAA AATGTCGAAA TCACTCGGCA ACACCATTTT CCTCTCCGAT 
CCACCCGACG AAGTGCTCCG CAAAATGCGC ACGGCGGTTA CCGATACCCA AAAAGTGCGC 
AAAAACGATG CAGGACGCCC CGAAGTGTGC ACCGTTTTTA GTTACCACAA ACGCTTTTCC 
ACGCCTGAGC AGTGCGAAGA AATTGCGGCT GGCTGCCAAA GCGGAGCGCT TGGTTGCGTT 
GATTGTAAAA AGCAGTGTGC CGCAAACATT TCTGCTGAAC TTGCACCGCT CTTAGAACGC 
CGCACATACT ACGAAGCTCG CATGGATGAG GTGAAAAATA TTTTATTTGA GGGAGAAGCA 
AAAGCGCGCA CCGTTGCCGA ACAGACCATG CAAGAGGTAC GCACCGCAAT GAAGCTTGGT 
GAAGCAAATT GCAGCGCCAC TTTTTTCAAC ACTTCATGTT CATAG

Protein sequence

MATARILSGM RPTGKLHLGH YTGALENWVA QQNQCSADGN RAYDTYFLIA DYHTLTTSLS 
TDDVYAHSLD MLVDWLAAGI DPEKSPMFRQ SQVKQHAELF LLFSMLITSA RLERNPTLKE 
QVRDLHMDSM SYGHLGYPVL QSADILLYKA NVVPVGEDQI PHVEITREIA RKFNNHFPHP 
LYGNVFAEPE PKITKFARLA GLDGKAKMSK SLGNTIFLSD PPDEVLRKMR TAVTDTQKVR 
KNDAGRPEVC TVFSYHKRFS TPEQCEEIAA GCQSGALGCV DCKKQCAANI SAELAPLLER 
RTYYEARMDE VKNILFEGEA KARTVAEQTM QEVRTAMKLG EANCSATFFN TSCS