Gene Cag_0150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0150
Symbol
ID	3747196
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	167801
End bp	169042
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	47%
IMG OID	637772677
Product	hypothetical protein
Protein accession	YP_378471
Protein GI	78188133
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.00771241
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAGAG AGCAAGCATC CACCCTGCGC ACCATTTTTA GTATGCCCGT TATTGTGGCG 
GCGCTTGGCT ACTTTGTTGA CATTTACGAC CTCGTGCTTT TTAGCATTGT GCGTGTGCCG 
AGCCTGAAAT CGCTTGGGCT TTCGGGGCAG GAGCTGATTG ATTACGGGGT CTATTTGCTC 
AATATGCAAA TGATTGGCAT GTTGCTTGGA GGCTTTCTTT GGGGGTGGCT TGGCGATAAA 
AAAGGGCGCC TTAAAATTAT GTTTGCCTCT ATTTTAATGT ACTCCTTAGC CAACATTGCC 
AATGGTTTTG TAACCACGCT GCCGATGTAT GCGGCGTTGC GCTTTATTGC AGGCGTTGGC 
TTAGCGGGTG AGCTTGGGGC AGGCATTACC TTAGTGGCAG AAATTTTACC CACAAAAATT 
CGAGGTTACG GCACCATGCT TGTTGCCTCA ATTGGGGTGT CGGGGGCTAT TCTTGCTAAT 
TATGTAGCTA CAACTTTTGA ATGGCACAAC GCCTTTTTTA TTGGTGGAGC GTTAGGTTTG 
CTGCTGCTTG CGGCACGCTT TAAGGTGTCG GAATCGGGCA TGTTTCAAGC AATGGCAGAT 
CACCGTGGCA CCAATCGAGG CAATATGGCA GCGCTCTTTA CCGACCGCAG TCGCTTTTTG 
CGCTATCTCA ACTCCATTAT GATTGGTGTG CCCATCTGGT TTGTGGTGGG TGTGCTTATT 
ACTTTTTCAC CTGAATTTGG CGAAAAGCTC TCCATCAGCG CACCCGTTTC GGCGGGTAAT 
GCTGTGATGT ATTGCTATCT CGGTTTGGTG TTTGGCGACC TTTCCAGTGG CTTGTTAAGT 
CAGTTGCTCA AAAGCCGCAA AAAGGTTGTG TTGCTCTTTA TGGTGCTTAC GGTTGCAGGC 
GTAGCACTCT ACTTTACGCA ACATGGGCAA ACGCCACAGT TTTTTTACAT GGTATGTGCT 
TTTCTGGGTT TTGCCAGCGG CTATTGGGCA ATTTTTGTAA CCGTTGCAGC CGAACAGTTT 
GGTACCAATC TTCGTGCTAC CGTAGCAACC ACCGTTCCAA ATCTTGTACG CGGTATGGTG 
GTGCCCATCA CCATGTTGTT CCAATATTTT AGAGGCATGT TTGGTATGGA GCTTGGCGCT 
CTTGTGGTAG GCGTAATTTG TATAGTTGGA GGATTTTTAT CATTAATGGC ATTAAGTGAA 
ACCTTTCATA AAGACCTCGA TTTTTATGAA GAGTTTTTGT AG

Protein sequence

MEREQASTLR TIFSMPVIVA ALGYFVDIYD LVLFSIVRVP SLKSLGLSGQ ELIDYGVYLL 
NMQMIGMLLG GFLWGWLGDK KGRLKIMFAS ILMYSLANIA NGFVTTLPMY AALRFIAGVG 
LAGELGAGIT LVAEILPTKI RGYGTMLVAS IGVSGAILAN YVATTFEWHN AFFIGGALGL 
LLLAARFKVS ESGMFQAMAD HRGTNRGNMA ALFTDRSRFL RYLNSIMIGV PIWFVVGVLI 
TFSPEFGEKL SISAPVSAGN AVMYCYLGLV FGDLSSGLLS QLLKSRKKVV LLFMVLTVAG 
VALYFTQHGQ TPQFFYMVCA FLGFASGYWA IFVTVAAEQF GTNLRATVAT TVPNLVRGMV 
VPITMLFQYF RGMFGMELGA LVVGVICIVG GFLSLMALSE TFHKDLDFYE EFL