Gene TM1040_3724 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3724
Symbol	paaA
ID	4075431
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	+
Start bp	784063
End bp	785055
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	60%
IMG OID	638005244
Product	phenylacetate-CoA oxygenase subunit PaaA
Protein accession	YP_611953
Protein GI	99078695
COG category	[S] Function unknown
COG ID	[COG3396] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02156] phenylacetate-CoA oxygenase, PaaG subunit

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.802749
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACGCGC AGATGGTCAA ATCGACCGGC ACGGGAGTTA AATCTACCGA GGAAATGAGC 
GCCGAAGAGC GCGCGTTTCA GGCCCGTATC GATGCGGGCG AAAAAATCGA GCCGAAAGAC 
TGGATGCCCG AGGGCTATCG CAAGACGCTG ATCCGCCAGA TCGGCCAGCA CGCGCATTCC 
GAGATTGTCG GCCAGCTGCC CGAGGGCAAC TGGATCACCC GCGCACCGAC GCTGGAACGC 
AAGGCGATCC TGCTGGCGAA AGTACAAGAC GAGGCGGGCC ACGGGCTCTA TCTCTACTGT 
GCCGCTGAAA CGCTGGGCGT CAGCCGTGAC GAGATGACCG AGATGCTCTT GGACGGGCGG 
ATGAAGTATT CGTCGATCTT CAACTATCCG ACCCTGACAT GGGCCGATAT GGGTGCTGTC 
GGCTGGCTCG TGGATGGCGC GGCGATCATG AACCAGGTGC CGCTGCAGCG CACCTCCTTT 
GGCCCCTATT CGCGTGCGAT GATCCGGGTG TGCAAGGAAG AGAGTTTTCA TCAGCGTCAG 
GGCTTTGACA TCATGATGAA GATGGCGCAG GGCACGCCGC AGCAAAAAGC GATGGCTCAG 
GATGCGCTCA ACCGCTTCTG GTATCCGGCG CTGATGATGT TCGGCCCCTC GGACAAGGAC 
TCGGTGCATT CCGCGCAGTC GATGGCGTGG AAAATCAAGA TGAACACCAA TGACGAGCTG 
CGCCAGAAGT TCGTCGATCA GACCGTGCCA CAGGCGGAAT ACCTCGGCCT AACCGTGCCG 
GACGAGAACC TCAAATGGAA CGAGGAAAAG GGCGGCTACG ACTTTTCCGA GCCCGACTGG 
GAAGAGTTCT TTGAGGTCAT CAAAGGCAAC GGCCCCTGCA ACACCGACCG CCTGGCCGCG 
CGCAACAAGG CCTGGGACGA CGGCAAATGG GTGCGCGAGG GCATGATGGC CCACGCCGAA 
AAGAAACGCG CCCGCAAGAT GGCGGCGGAG TAA

Protein sequence

MYAQMVKSTG TGVKSTEEMS AEERAFQARI DAGEKIEPKD WMPEGYRKTL IRQIGQHAHS 
EIVGQLPEGN WITRAPTLER KAILLAKVQD EAGHGLYLYC AAETLGVSRD EMTEMLLDGR 
MKYSSIFNYP TLTWADMGAV GWLVDGAAIM NQVPLQRTSF GPYSRAMIRV CKEESFHQRQ 
GFDIMMKMAQ GTPQQKAMAQ DALNRFWYPA LMMFGPSDKD SVHSAQSMAW KIKMNTNDEL 
RQKFVDQTVP QAEYLGLTVP DENLKWNEEK GGYDFSEPDW EEFFEVIKGN GPCNTDRLAA 
RNKAWDDGKW VREGMMAHAE KKRARKMAAE