Gene TM1040_2548 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2548
Symbol
ID	4076679
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2689525
End bp	2690880
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	60%
IMG OID	638007872
Product	coproporphyrinogen III oxidase
Protein accession	YP_614542
Protein GI	99082388
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0635] Coproporphyrinogen III oxidase and related Fe-S oxidoreductases
TIGRFAM ID	[TIGR00538] oxygen-independent coproporphyrinogen III oxidase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.963821
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.259779
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACAGG AATCTCAATT GGCGCGGCTC GGACTTTTCG ACGCAAAGGT GCCCAGATAT 
ACAAGTTACC CGACTGCGCC ACACTTCAAC AATGACGTGA GCGCAGCGCG TTTTGCCTCC 
TGGATCGGGT CTATCAAGCC CGGCGCAGAA ATCTCGCTAT ACGTGCATGT GCCCTTCTGT 
CGCAGGCTGT GCTGGTTTTG CGCATGCCGC ACGCAGGGCA CGCAGTCCGA GTCACCTGTG 
CGCGCCTACA TAGAGGTGTT GAAGCAAGAA CTTGCGCTTC TTGCGCGTGC CCTACCCGAA 
GGCGTCCGCC TTGCGCGGCT GCATTGGGGC GGCGGGACGC CCACGCTCCT CAGTGCCGAA 
ATGATCTCTG ATCTGGCGGA GGCGATCTTT GCCGTGACGC CGATGGCGAA GGGCGGCGAG 
TTCTCCGTTG AGATCGACCC AAATGAAATC GACGATGCGC GCCTCGACGC CCTCGCGGCG 
GCGGGGATGA ACCGTGCCTC GATCGGCGTT CAGGATTTTG ACCCCCAGAT CCAGGAAACC 
ATCGGTCGCA TTCAGCCTTT TGATCTGACG CGCGACGCCG TCGACATGAT CCGCGCGCGG 
GGCATCACAA GCCTCAATGC AGATATTCTC TTCGGGCTGC CGCATCAGAA CCGGATGCGC 
ATGACCGAAA GCGTGCAAAA ACTGCTGTCG CTCTCGCCGG ATCGCGTGGC ACTCTATGGC 
TATGCCCATG TGCCATGGAT GGCGCGGCGC CAGAATATGA TTCCAACCGA CAGCCTACCG 
TCACCTCAAA CCCGACTACA GTTGTTTGAG ACCGCGCAGC GATTGTTTCA GTGGGATGGC 
TATCGCGAAA TTGGTATCGA CCATTTTGCC ACGCCCCACG ATGGGCTGGC GGTTGCGGCC 
CGGACGGGGC GGCTGCGCCG GAACTTTCAG GGTTACACCG ATGATCGGGC AGATGTGTTG 
ATCGGCCTTG GGGCATCCTC TATCTCGCGT TTTCCGCAGG GCTATGCTCA GAATGCTCCA 
TCCACATCGG CCTACACCAA GGCTATTCGT GACGGACAGT TTTCCACCGC GCGCGGCCAT 
GTGTTTTCGG GCGAGGATTT GCTGCGTGGG CGCATGATCG AAGCCCTGAT GTGTGATTTC 
GAGATTGCAA CCGACGATAT TCGGGCACAG TTCGACATCA CGCAAGACGC ATTGGAGCGC 
ATGTATCGCG AGGCCTCCGT CGCCTTTCCG GAAATGCTCG ACGTCACCCC ATCGGGGCTG 
CGGGTAAGAC CCGAAGGCAA GCCCCTGACG CGAATGGTGG CGCGCCACTT TGATGCCTAT 
GACCTGAGCA AGGCCGGACA TAGCTCGGCG ATCTAG

Protein sequence

MTQESQLARL GLFDAKVPRY TSYPTAPHFN NDVSAARFAS WIGSIKPGAE ISLYVHVPFC 
RRLCWFCACR TQGTQSESPV RAYIEVLKQE LALLARALPE GVRLARLHWG GGTPTLLSAE 
MISDLAEAIF AVTPMAKGGE FSVEIDPNEI DDARLDALAA AGMNRASIGV QDFDPQIQET 
IGRIQPFDLT RDAVDMIRAR GITSLNADIL FGLPHQNRMR MTESVQKLLS LSPDRVALYG 
YAHVPWMARR QNMIPTDSLP SPQTRLQLFE TAQRLFQWDG YREIGIDHFA TPHDGLAVAA 
RTGRLRRNFQ GYTDDRADVL IGLGASSISR FPQGYAQNAP STSAYTKAIR DGQFSTARGH 
VFSGEDLLRG RMIEALMCDF EIATDDIRAQ FDITQDALER MYREASVAFP EMLDVTPSGL 
RVRPEGKPLT RMVARHFDAY DLSKAGHSSA I