Gene Cphamn1_1163 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphamn1_1163
Symbol
ID	6374838
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides BS1
Kingdom	Bacteria
Replicon accession	NC_010831
Strand	+
Start bp	1251046
End bp	1252185
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	52%
IMG OID	642683662
Product	glucose sorbosone dehydrogenase
Protein accession	YP_001959579
Protein GI	189500109
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00834081
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGGCTAT TACCCTTAAA GAGTTGTCTG TCATTGTTTC TGGTCATGAT TTCCTGCAAT 
GCTTGTGCCG AGCCTGTTAG TAACAGGATT GAGGGGAATG CGGGCTCAAG TCTCCTATCC 
GAGAGTTTTG GGACATTCAA TGAACCCTGG GCCATGACTT TTCTTCCGGA TGGTGATCTC 
CTGGTAACTG AAAAAGGAGG AACTCTGCTT CTGGTCAAAC CGGATGACCG TTCCAGGGTT 
CCGGTCCAGG GTGTACCCGA GGTGGCTTAC GGTGGTCAGG GCGGCCTTGG TGATATAATT 
CTGCACCCTC GATATATGGA TAACAACTGG ATTTACCTGT CATATGTCGA GCAGGATGCT 
TCAGGAAAGA GGGGAGCAGC AGTTGCCCGG GCTCGATTTC GGCCAGCATC GGCCGGGGCA 
AAACTGGAAA ACCTCGAAGT CATCTGGCGG CAAGAGCCTA AAGTATCTGG CAACGGGCAT 
TACTCATACA GGTTGGCATT CAGCCCGGAT GGGCATCTTT TTATCACTTC CGGTGATCGT 
CAAAAACAGA CGCCGGCACA GAGCTGGAGA CAAAGTCTTG GCAAGGTGAT CAGGTTAAAC 
GCGGATGGAT CAGTCCCACC GGACAATCCG TTTCAGGATA AAGGAGAACT TGCAAAAACC 
TTCTGGTCTC TCGGGCATCG AAATCTTCTT GGGATTGCAT TTGACAAAAA GGGGCAACTG 
TGGACACACG AAATGGGCCC CAGGAACGGT GATGAATTCA ACCTGACCAT TGGTGGAGAT 
AATTACGGTT GGCCCATTGT ATCATGGGGC GATCACTACT CCGGTCTTCC AATTCCCGAT 
CATGATACGC GTCCGGAATT CAATGCACCG GAGATATACT GGGTACCAAC CGTTGCACCT 
TCAGGCCTGA TACTCTACTC CGGTTCTCTG TTTCCGGCGT GGCAGGGCAA TGCCTTTATC 
GGAGGGCTCA GATCACAATC ACTGATACGG ATCAGGATTG AAGGGAACCA GGCGGAGGAG 
GTCGAACGTT TTTCCATGGG AAAACGAATA CGGGAGGTTG AGCAAGGACC AGACGGCGCC 
ATATGGGTTC TGGAGGATAC TAATGGTGGC CGCCTGATCC GCCTCAGCGA ATACAAGTAG

Protein sequence

MRLLPLKSCL SLFLVMISCN ACAEPVSNRI EGNAGSSLLS ESFGTFNEPW AMTFLPDGDL 
LVTEKGGTLL LVKPDDRSRV PVQGVPEVAY GGQGGLGDII LHPRYMDNNW IYLSYVEQDA 
SGKRGAAVAR ARFRPASAGA KLENLEVIWR QEPKVSGNGH YSYRLAFSPD GHLFITSGDR 
QKQTPAQSWR QSLGKVIRLN ADGSVPPDNP FQDKGELAKT FWSLGHRNLL GIAFDKKGQL 
WTHEMGPRNG DEFNLTIGGD NYGWPIVSWG DHYSGLPIPD HDTRPEFNAP EIYWVPTVAP 
SGLILYSGSL FPAWQGNAFI GGLRSQSLIR IRIEGNQAEE VERFSMGKRI REVEQGPDGA 
IWVLEDTNGG RLIRLSEYK