Gene TM1040_2219 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2219
Symbol
ID	4078210
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2330775
End bp	2332091
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	66%
IMG OID	638007541
Product	cobyrinic acid a,c-diamide synthase
Protein accession	YP_614213
Protein GI	99082059
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1797] Cobyrinic acid a,c-diamide synthase
TIGRFAM ID	[TIGR00379] cobyrinic acid a,c-diamide synthase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.867959
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCCCT TCCCCAAAGG CCTGATGATC TCCGCGCCCT CCTCCGGCAC CGGCAAGACC 
ACTGTCATGC TGGGCCTTCT GCGCGCGCTC AAGGACGATG GCCTGACCGT CCAGCCGTTC 
AAAAGCGGGC CGGATTATAT CGACCCGGCC TTCCACCTTG CTGCCGCCAG ACGGGCGTCC 
TTCAACCTTG ATACATGGGC CATGGACGAC ACGCTGCTAG ACGCTGTCAC CACCCAAGCC 
CAAGGCGCGG GCATCTGCGT CGGCGAAGGG TCGATGGGGC TCTTCGACGG AGTCGCCACC 
CGCGGTCAGT CCGGCTTTGG CTCCTCCGCG GAAACCGCGC TCAGGATGGG CTGGCCGGTG 
GTGCTGGTGA TTGATGTGGG CGGTCAGGCG CAGTCGGCGG CGGCCACCGC GCTGGGGTTC 
AAGATGTATA ACCCCGATCT GCCCTTTGCC GGAGTGATCT TGAACCGGGT CGCGAGTCCC 
CGTCACGACC GGCTTACCCG GCTTGGGATG GAGCGGGCGG GCGTCAAGGT GCTGGGCTCC 
CTGCCGAGAC GCGGCGATCT GGCTCTGCCC GAACGCCATC TCGGCCTCAT TCAGGCGGTT 
GAACACCCCG ATCTTGAGGC CGCAATCGCC GGCTATGCGG CCTTCTTGCG CGAAAACGTC 
GACATTGACG CGATCCGGGC GGTGGCCAGC TCCGCCGCAG CACCGGCCCC TCGCGCCCTG 
CCGCGTCCGC CCGCACAACG CATCGCATTG GCGCGCGATG CGGCGTTTTC CTTTACCTAT 
CCGCATCTTC TCGAGGGTTG GCGCGCCGCC GGAGCAGAGA TCCTGCCCTT CTCGCCGCTC 
AACAATGAAG CCCCCGCCAA GGACGCCGAT CTGGTCTGGC TGCCCGGGGG CTATCCCGAG 
TTGCACGGCT CCACCCTCGC CGCAGCCGAC ATCTGGCGCA AAGGCATGGC AGAACACGCA 
AAAACCAAAC CGGTGCATGG CGAGTGCGGC GGCTACATGG CCCTTGGCGA GGCCTTGATC 
GACAAGGACG GCACGCGGCA CCAGATGGCG GGGCTCCTTG GGCTTGTGAC ATCCTATGAA 
AAGCGCAAGT TCCACCTCGG GTATCGCCGC GCAGCGCTAG AAGCGCCGAT GCCGGGCTTT 
GACAGCGGCG CGTTTCTGCG CGGACATGAG TTCCATTATT CGACCATCCT CGACGAGCCA 
GACGCCCCAC TGGCCCGGGT GATGGACGCC GACGGCAACC CGGTGCCCGA GACCGGCTCC 
GTCAAAGGCC ATGTCACCGG TACGTTCTTT CACCTCATCA CCGGAGAGCA GCCATGA

Protein sequence

MIPFPKGLMI SAPSSGTGKT TVMLGLLRAL KDDGLTVQPF KSGPDYIDPA FHLAAARRAS 
FNLDTWAMDD TLLDAVTTQA QGAGICVGEG SMGLFDGVAT RGQSGFGSSA ETALRMGWPV 
VLVIDVGGQA QSAAATALGF KMYNPDLPFA GVILNRVASP RHDRLTRLGM ERAGVKVLGS 
LPRRGDLALP ERHLGLIQAV EHPDLEAAIA GYAAFLRENV DIDAIRAVAS SAAAPAPRAL 
PRPPAQRIAL ARDAAFSFTY PHLLEGWRAA GAEILPFSPL NNEAPAKDAD LVWLPGGYPE 
LHGSTLAAAD IWRKGMAEHA KTKPVHGECG GYMALGEALI DKDGTRHQMA GLLGLVTSYE 
KRKFHLGYRR AALEAPMPGF DSGAFLRGHE FHYSTILDEP DAPLARVMDA DGNPVPETGS 
VKGHVTGTFF HLITGEQP