Gene BBta_4067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_4067
Symbol	ispDF
ID	5153386
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	-
Start bp	4261124
End bp	4262305
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	68%
IMG OID	640558900
Product	2-C-methyl-D-erythritol 4-phosphate cytidylyltransferase 2-C-methyl-D-erythritol 2,4-cyclodiphosphate synthase
Protein accession	YP_001240039
Protein GI	148255454
COG category	[I] Lipid transport and metabolism
COG ID	[COG0245] 2C-methyl-D-erythritol 2,4-cyclodiphosphate synthase [COG1211] 4-diphosphocytidyl-2-methyl-D-erithritol synthase
TIGRFAM ID	[TIGR00151] 2C-methyl-D-erythritol 2,4-cyclodiphosphate synthase [TIGR00453] 2-C-methyl-D-erythritol 4-phosphate cytidylyltransferase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.438057
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGATTT CTCAGCGGAC TGCAGCCATT CTCGTCGCGG CCGGACGCGG CCTGCGCGCC 
GGCACCGGCG GTCCGAAGCA ATATCGCGCG ATCGGCGGCC GCACCGTCAT CCACCGCGCG 
CTCGCCGCCT TTTCGGAGCA TCCTGACGTC GCCGTCGTGC AGCCGGTGGT GAACCCCGAT 
GACATCGACG TCTTCAATGC CGCGGTCAGT GGCCTGCGCC ACGAGGTGCC CGCGCATGGC 
GGCGCGACAC GGCAGGCGTC AGTGCTCGCA GGCCTGGAAG CGCTGGTGCC GCACCGACCG 
GACATCGTGC TGATCCACGA CGCCGCGCGC CCGTTCGTGA CATCGGCCGT GATCTCGCGC 
GCGATCCAAG CGGCCGGCAA GACCGGCGCG GCCATTCCCG TCGTGCCCGT CACCGACACG 
ATCAAGGAGG TCACGGCGAG CGGCGACATC ATCGCGACAC CGGAGCGCGC GAAGCTGCGC 
ATCGCGCAGA CGCCGCAGAC CTTCAAATTC GAGGTCATCC TGGAGGCGCA TCGGCGCGCC 
GCGCGCGACG GCCTCACCGA GTTCACAGAT GATGCGGCGA TCGCCGAATG GGCGGGATTG 
ACCGTCGCGA CGTTTGAGGG CGATGTTGCC AATATGAAGC TCACCACACC CGAAGATTTC 
GTGCGCGAGG AAGCGCGGCT CGCCGCTCAG CTCGGCGACA TCAGGACCGG CACCGGCTAC 
GACGTGCATG CCTTCGGCGA GGGCGACCAT GTCTGGCTGT GCGGCCTGCG CGTGCCGCAT 
AGCAAGGGCT TCCTGGCCCA CTCCGACGGC GACGTCGGAT TGCACGCCCT GGTTGACGCA 
ATTTTGGGCG CCCTGGCCGA TGGTGACATC GGCTCGCATT TCCCGCCCTC GGACATGAAG 
TGGAAGGGCG CCTCGTCCGA TCAGTTCCTG AAATACGCGA TCGAGCGGGT CACGGCGCGC 
GGCGGACGGG TGGCCAATCT CGAGGTGACG ATGATCTGCG AACGGCCGAA GATCGGTCCC 
CTGCGCGACC AGATGCGCGC ACGCATCGCC GAGATTTCGG GAGTCGATAT CTCGCGCATC 
GCGGTGAAAG CCACCACCAG CGAGCGCCTC GGCTTCACCG GCCGCGAGGA AGGCATCGCC 
GCGACCGCAA GTGCGACGAT CCGGCTGCCG TGGAGCGCAT GA

Protein sequence

MTISQRTAAI LVAAGRGLRA GTGGPKQYRA IGGRTVIHRA LAAFSEHPDV AVVQPVVNPD 
DIDVFNAAVS GLRHEVPAHG GATRQASVLA GLEALVPHRP DIVLIHDAAR PFVTSAVISR 
AIQAAGKTGA AIPVVPVTDT IKEVTASGDI IATPERAKLR IAQTPQTFKF EVILEAHRRA 
ARDGLTEFTD DAAIAEWAGL TVATFEGDVA NMKLTTPEDF VREEARLAAQ LGDIRTGTGY 
DVHAFGEGDH VWLCGLRVPH SKGFLAHSDG DVGLHALVDA ILGALADGDI GSHFPPSDMK 
WKGASSDQFL KYAIERVTAR GGRVANLEVT MICERPKIGP LRDQMRARIA EISGVDISRI 
AVKATTSERL GFTGREEGIA ATASATIRLP WSA