Gene Cphamn1_1889 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphamn1_1889
Symbol
ID	6375581
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides BS1
Kingdom	Bacteria
Replicon accession	NC_010831
Strand	-
Start bp	2052887
End bp	2053924
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	53%
IMG OID	642684386
Product	dTDP-glucose 4,6-dehydratase
Protein accession	YP_001960287
Protein GI	189500817
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1088] dTDP-D-glucose 4,6-dehydratase
TIGRFAM ID	[TIGR01181] dTDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0868281
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00930049
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCACATTC TCATCACCGG GGGGGCGGGG TTTATCGGAT CGCATGTGGT GCGGTATTTT 
GTCGATACCT ACCCGGAATA CAGCATCACC AATCTTGACA AATTGACCTA CGCGGGTAAT 
CTGGAGAACC TGCGGGATGT GGAGGATCGT TCGAATTACC GCTTTGTCAG GGGTGATATT 
ACCGATGGCG CAGTCATGCT GGAGCTTTTT GAAAAAGAGC TTTTTGACGG CGTGATCCAT 
CTTGCCGCCG AGTCGCACGT CGATCGTTCG ATTGCCAATC CGACCGGGTT TGTCATGACC 
AATGTGCTGG GTACGGTGAA TCTGTTGAAC GCGGCAAGAG CACTCTGGCA AGACGACTAC 
AGCGGAAAAC TTTTCTACCA TGTCTCGACC GATGAGGTCT ATGGTGCCTT GGGTGGCGAG 
GGCATGTTTA CCGAAGAGAC CTCTTACGAT CCGCACAGCC CGTATTCAGC GTCCAAAGCC 
TCTTCGGATC ATTTTGTCCG TGCGTATCAC GATACCTACG GACTGCCTGT GGTGATCAGC 
AATTGCTCGA ACAACTACGG ACCGTGTCAG TTTCCGGAAA AGCTGATCCC GCTGTTCATC 
AATAACATCA GGAACAACAA GCCGCTTCCT GTTTACGGAA AAGGAGAGAA CGTCCGGGAC 
TGGTTGTGGG TCATCGATCA CGCCCGGGCG ATCGACATGA TTTATCACAA GGGAAAGCAG 
GGGGAGACCT ACAATATCGG GGGAAACAAC GAGTGGACGA ACATCGCGCT GATCAGACTG 
CTCTGCAGTA TCATGGACCG GAAGCTCGGT CGCCCGGAAG GAGAATCCGG GAAATTGATC 
ACCTGTGTGA CCGATCGGGC AGGCCACGAT TTCCGCTACG CGATCGACTC CTCAAAACTT 
CAGCGGGAAC TGGGATGGAC ACCTTCGCTT CAGTTTGAAG AGGGACTGGA GAAGACGGTG 
GACTGGTATC TGGAGAACAG CACCTGGCTC GATCATATCG CCTCGGGGGA GTATTTGAAG 
AGAGTGACTA ATGAGTAA

Protein sequence

MHILITGGAG FIGSHVVRYF VDTYPEYSIT NLDKLTYAGN LENLRDVEDR SNYRFVRGDI 
TDGAVMLELF EKELFDGVIH LAAESHVDRS IANPTGFVMT NVLGTVNLLN AARALWQDDY 
SGKLFYHVST DEVYGALGGE GMFTEETSYD PHSPYSASKA SSDHFVRAYH DTYGLPVVIS 
NCSNNYGPCQ FPEKLIPLFI NNIRNNKPLP VYGKGENVRD WLWVIDHARA IDMIYHKGKQ 
GETYNIGGNN EWTNIALIRL LCSIMDRKLG RPEGESGKLI TCVTDRAGHD FRYAIDSSKL 
QRELGWTPSL QFEEGLEKTV DWYLENSTWL DHIASGEYLK RVTNE