Gene Clim_1863 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1863
Symbol
ID	6355204
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	2047125
End bp	2048084
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	57%
IMG OID	642669466
Product	dihydroorotate dehydrogenase family protein
Protein accession	YP_001943880
Protein GI	189347351
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01037] dihydroorotate dehydrogenase (subfamily 1) family protein

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTCCG ACGCTTCGCC TCAAATAGTC AAGCCCGCTG CCGCCGTATC GCTCGGCCGC 
GGGCTTGACC TCAGGTCTCC GGTCATGCTT GCTTCAGGCA CCGTATCTTA CGGCGAAGAG 
CTCAGCAGGC TCTGCGACCT TCGAAAAATC GGGGGAATCG TCACCAAAGC GATCTCTCTC 
GAACCCAGAA CCGGAAATCC TCCCCAGCGC ATTGCCGAAA CCCCGTCCGG CATGATCAAC 
GCCATCGGGC TTGCCAATGT CGGGGTTGAA CGATTTATCG CCGAAAAAGT CCCCTTTCTG 
CGGGGACTCG GCACGGCGGT CATCGTCAAC ATCGCCGGCC GCTCCATCGA CGACTACTGC 
GAAGTGGTCT CCAGGCTCGA CACCGTCGAA GGCCTCCACG CATACGAAAT CAATCTCTCC 
TGTCCCAACG TCAAAGGCGA ATGCATGATC ATGGGCGTCA GCCGCGACGC AACCTTTGAA 
ATCGTCTCCG AACTCCGCAA GCTGACCCGG CGCCACCTCA TGATCAAACT GACGCCCAAC 
GTCACATCCA TCAGCAGCAT AGCCCTTGCC GCCCAGGAAG CCGGAGCCGA CTCCGTATCG 
CTCATCAACA CCCTCGTCGG CATGGCCGTC AACTACAAAA CCCGAAAACC GCTCATTAAA 
AACCGTCACC GGAGGCCTCT CAGGACCGGC AATAAAACCC GTAGCACTTG CAAAAGTCTG 
GGAAGTCTAC AACGCCGTAA ATATTCCGGT AGTAGGCATG GGAGGCATAG GCAGCTTCGA 
AGACGCCATG GAATTCCTGC TCGTCGGTGC AAGCGCAATA CAGATAGGCA CCATGAACTT 
CGTCTACCCC GACATCAGCC AGCGAATCGC CCAAGCCATC GAAACCCACT TCTCCGCACC 
AAACGCCCCG GCATACCAGG ATTATGTGGG AAGCCTGATT GTTTAAATGC CGTTGGCTGA

Protein sequence

MNSDASPQIV KPAAAVSLGR GLDLRSPVML ASGTVSYGEE LSRLCDLRKI GGIVTKAISL 
EPRTGNPPQR IAETPSGMIN AIGLANVGVE RFIAEKVPFL RGLGTAVIVN IAGRSIDDYC 
EVVSRLDTVE GLHAYEINLS CPNVKGECMI MGVSRDATFE IVSELRKLTR RHLMIKLTPN 
VTSISSIALA AQEAGADSVS LINTLVGMAV NYKTRKPLIK NRHRRPLRTG NKTRSTCKSL 
GSLQRRKYSG SRHGRHRQLR RRHGIPARRC KRNTDRHHEL RLPRHQPANR PSHRNPLLRT 
KRPGIPGLCG KPDCLNAVG