Gene Clim_1408 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1408
Symbol
ID	6356179
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	1513173
End bp	1514510
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	50%
IMG OID	642669019
Product	nucleotide sugar dehydrogenase
Protein accession	YP_001943447
Protein GI	189346918
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1004] Predicted UDP-glucose 6-dehydrogenase
TIGRFAM ID	[TIGR03026] nucleotide sugar dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0334536
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATAA CAATATTTGG GTCCGGGTAC GTCGGCCTTG TCACTGGAGC ATGTTTTGCC 
GAGGTCGGCA ACGAAGTGTT GTGTGTGGAT ATTGATCAGG CAAAAATCGA CAGGCTCAAT 
AACGGAGAAA TTCCTATTTA TGAACCTGGT CTTGATGCCA TTGTGCATGA GAACAGCCGG 
AAGGGCCGTT TGCGGTTTAC TTCGAATATT CCTGAAGGCG TCGAGTTCGG TCTCTATCAG 
TTTATTGCCG TAGGCACTCC GCCCGATGAA GACGGTTCAG CCGATTTGCG CCATGTACTC 
AGTGTTGCGG AAAGTATTGG CGCCCACATG CAGGATTACC GCATTATCAT CAATAAATCG 
ACAGTCCCTG TCGGTACTGC GGATCTGGTT CGTGAAAAGG TACTTTCAGT ATTGGATGCA 
AGGAATGCCG GCATCGATTT CGATGTGGTG TCAAATCCGG AGTTCCTCAA GGAGGGAGAT 
GCGGTCAACG ATTTCATGAA ACCGGAACGG ATCGTGGTCG GCGTCGATAA TCCCCGAACC 
AAAGAGCTGC TTCGTTTTCT TTATTCGCCA TTCAACCGCA GCCACGAGCG TTTTATCGCC 
ATGGATGTCC GTTCGGCCGA GTTGACCAAA TACGCAGCAA ATTCGATGCT TGCGACGAAG 
ATCAGCTTCA TGAACGAGAT TGCCAACATT GCCGAACTTG TGGGAGCAGA TGTCGAGGAG 
GTTCGCAGAG GCATAGGATC GGATTCCCGC ATCGGCTTTT CTTTTATTTA TCCCGGTGTA 
GGTTACGGGG GCTCCTGTTT TCCGAAGGAT GTTCAGGCTC TCGAACGTAC CGCCCGAAAA 
CACGGATATG ATTCCCGGAT TCTTCAGGCT GTCGAGGCAG TCAATCACGA TCAGAAAAAC 
AGTCTGGTAC GCAAGATGAA GGAGCATTTC AATGGAGATC TCAAGGGTAA GGTTATCGCG 
CTCTGGGGTC TTGCGTTCAA GCCCAATACC GATGATATGC GTGAAGCTCC CAGCCGCAGG 
GTGATTGAAG AACTTTGGAA GGAAGGTGCA CTGGTAAGGG TTTACGATCC GGTAGCCATG 
GAAGAAGCTC AAAGGATTTA TGGCGAAAAA GAAGGCTTGC ACTATGCCGA AAGTCCGGAT 
GAAGCAGTCT CCGGAGCTGA TGCACTTGCA ATTCTGACCG AATGGCTGAT GTTCCGCAGT 
CCGGATTTCG ATATGATAAA ACGGGAACTC AAGGAGCCGG TGATTTTCGA CGGGCGGAAC 
ATCTATAGTC CTGATTTTAT GGAGCAGTTC GGTTTTACCT ACTACTCGAT CGGCAGACGA 
CCGAGAGGTA TCAGCTGA

Protein sequence

MKITIFGSGY VGLVTGACFA EVGNEVLCVD IDQAKIDRLN NGEIPIYEPG LDAIVHENSR 
KGRLRFTSNI PEGVEFGLYQ FIAVGTPPDE DGSADLRHVL SVAESIGAHM QDYRIIINKS 
TVPVGTADLV REKVLSVLDA RNAGIDFDVV SNPEFLKEGD AVNDFMKPER IVVGVDNPRT 
KELLRFLYSP FNRSHERFIA MDVRSAELTK YAANSMLATK ISFMNEIANI AELVGADVEE 
VRRGIGSDSR IGFSFIYPGV GYGGSCFPKD VQALERTARK HGYDSRILQA VEAVNHDQKN 
SLVRKMKEHF NGDLKGKVIA LWGLAFKPNT DDMREAPSRR VIEELWKEGA LVRVYDPVAM 
EEAQRIYGEK EGLHYAESPD EAVSGADALA ILTEWLMFRS PDFDMIKREL KEPVIFDGRN 
IYSPDFMEQF GFTYYSIGRR PRGIS