Gene TM1040_1455 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1455
Symbol
ID	4077752
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1553254
End bp	1554612
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	62%
IMG OID	638006766
Product	cytochrome P450
Protein accession	YP_613450
Protein GI	99081296
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.756102
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.447397
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCTGC GCCCGCCAAA ACCCCCGGTA CGGCCTGACA GAGTCTCGCT CTGGCGCTAC 
CTGAAGCTGT TTCGGGCCGA TATTCTGTCG GCGCAGCCGC AGCGGCTCTA TCGGGCGTGG 
ATGGCAGAGT TTCGCACGCC CTTCTTTCGG TCCTTCCTGG TCAATCAACC TGCGCTTCTG 
GATGTGATCC TGAAAGAGCG CCCGGATGAT TTCCCGAAAT CCAACCGCGT GGGCGAGGGG 
CTGCGGCCAC TCCTTGGAAA CTCCGTCTTT CTGACCAATG GCGAGACCTG GAAACGGCAG 
CGGCGCATCA TTGATCCCGC CTTTGAGGGC GGTCGACTGA AGGAGAGCTT TCCAGCGATG 
CGCGCCGCAG CCGAGGCAGG GGTTGCGCGT TTGCGTCCAC ACGCGGATGG GTCAGAACTC 
GAGATCGAGG CTGAAGCCTC GCATATCGCG GCGGATGTGA TCTTTCGCAC GCTGTTTTCC 
ATTCCCATCG AACATGAGGT CGCCGCAGAG GTCTTTTCCC GGTTCCGCGC CTATCAGCAG 
GCGCAGCCGA TCCTCAATCT GGCGGCCTTT GTACCGGTGC CCCGCTGGAT GCCCCGGTTC 
TACCCCAAGG GAACCCGACA GAACGCGCGC CATATTCGCA GGCTGATTGC TGATCTGACC 
AAGGCTCGGA TGGCAGAGAT TGCCGCGGGC ACAGCACCAG ACGATCTGGC GACCAAGATT 
ATGACCACGC TGGACCCGGA AACCGGCAAA GGGTTTGGAG CCGAGGAAAT GGTCGATCAG 
GTGGCGATCT TCTTTCTGGC CGGGCATGAG ACCAGTGCCT CGGCGCTGGG GTGGGCGCTC 
TATCTGTTGG CGCTTTATCC CGAATGGCAG GAGAAGCTGG CCGCCGAAGT AGCAGAGCAT 
GGTGCAGAGG AATTTGCGGA TCTGTCAAAG CTGCGCCTGA CGCGCGATGT GTTTCGCGAG 
ACGCTGCGGC TGTATCCACC GGTGCCGATG ATGGTACGCG AGGCAGTTCA GACAGAGAGG 
TTCCGGGACC GCGAGGTGCT CAGGGGATCT CAGATGGTGC TCAGCCCTTG GCATCTGCAT 
CGCCACGAAC GTCTCTGGGA GCGGCCGGAT GAGTTCGATC CTGGCCGATG GCAGAGCGAG 
AACGGAAAAG CCTGTGCCCG GAACGCATAT ATGCCGTTCT CGGCGGGCTC CCGGGTCTGT 
ACGGGGGCCG GGTTTGCCAT GGTCGAGGGG GTCTTAATCC TCGCGCAAAT TCTGCGCCAC 
TATCGCATCA CGCCTGTCGA AGGTCGGAGC CCCGAGCCCG TTGCGCATCT GACGGTACGC 
TCTCGCACGG GCATCTGGCT GCGTTTTTCG CATCGCTAG

Protein sequence

MTLRPPKPPV RPDRVSLWRY LKLFRADILS AQPQRLYRAW MAEFRTPFFR SFLVNQPALL 
DVILKERPDD FPKSNRVGEG LRPLLGNSVF LTNGETWKRQ RRIIDPAFEG GRLKESFPAM 
RAAAEAGVAR LRPHADGSEL EIEAEASHIA ADVIFRTLFS IPIEHEVAAE VFSRFRAYQQ 
AQPILNLAAF VPVPRWMPRF YPKGTRQNAR HIRRLIADLT KARMAEIAAG TAPDDLATKI 
MTTLDPETGK GFGAEEMVDQ VAIFFLAGHE TSASALGWAL YLLALYPEWQ EKLAAEVAEH 
GAEEFADLSK LRLTRDVFRE TLRLYPPVPM MVREAVQTER FRDREVLRGS QMVLSPWHLH 
RHERLWERPD EFDPGRWQSE NGKACARNAY MPFSAGSRVC TGAGFAMVEG VLILAQILRH 
YRITPVEGRS PEPVAHLTVR SRTGIWLRFS HR