Gene Daro_3662 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3662
Symbol
ID	3567604
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	3936334
End bp	3937632
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	63%
IMG OID	637682135
Product	aminopeptidase P
Protein accession	YP_286861
Protein GI	71909274
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	59
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCACG CCCACTTTCT CGCCCGCCGC AAGCGCCTGC TGAAGACCAT CGGCGACGGC 
GTCGCCATCG TACCCACCGC ACCGGAAGTC ATTCGCAACC GCGATGCGCA TCATCTTTAC 
CGATTCGACA GCTATTTCTG GTATCTGACT GGCTTCCCGG AACCAGAAGC GGTCGTTGTG 
CTAATCGGCG GCAAGAAGCC GAAATCCATC CTCTTCTGCC GCGAAAAGCA TGAAGAACGC 
GAAATCTGGG ACGGCTATCG CTACGGCCCG AAAGCGGCAA AAACCGCCTT CGGCTTCGAC 
GCTGCCTATC CGATCGAGCA ACTCGACAAG AAACTGGCCG AGTTCCTGGT CGACCGCGAC 
ACACTGTGGC ACGCCATCGG TCACGACGCC GAATGGGACG CCCGGATCGC CAAGGCCCTG 
AACGAAGTCC GCGCCCAGAC CCGGGCCGGC AAGCGGGCGC CGCGCGCCAT TCACGACCTG 
CGCGCCGAAC TCGACGGTAT GCGCCTGGTC AAGGACAGTG CCGAGGCCGG CATCCAGCAA 
CGCTCGGCCG ATATTGCCAG CGCCGGCCAC GCCCGCGCCA TGCGCGCCTG CCGCCCCGGC 
ATGGCCGAGT ACGAACTGGA AGCCGAACTG ACTTACGAAT TCCGCAAGCG CGGTGCCGAT 
GCCCATGCCT ACACGCCCAT CGTTGCCGGT GGCACCAACG CCTGCGTGCT TCATTACGTG 
TCGAACGACA AGGTACTCAA CGACCACACC CTGGTCCTGA TCGACGCTGG TTGCGAAGTA 
GACGGTTACG CCGCCGACAT CACCCGTACT TTCCCGGTCA ATGGCCGCTT CAACCCCGCG 
CAGAAGGATG TGTACGAAAT CGTCCTCGCC GCGCAGACGG CGGCCGTCGC CGCCACCGCG 
CCAGGTCGCC ATTTCATGGA AGGCCACGAT GCCGCCGTCC GCGTGCTGAC TCAAGGCCTG 
ATCGACCTCA AGCTGCTCAC CGGCAACCTC GACAATCTGA TCGAAAAAGG TGATTACAAG 
CGCTTCTACA TGCACCGCAC CGGCCACTGG CTCGGGCTGG ATGTGCACGA CGCCGGCGAA 
TACAAGGTCG GCGACGCATG GACGACCTTG CAGCCAGGCA TGACCCTGAC CGTCGAACCC 
GGCCTCTACA TCCGCCCCGG CACCGATATC CCGCCAGCAC TGGCCGGCAT CGGCATCCGC 
ATCGAGGACG ACGTGCGCGT CACGGAGAAT GGTTGTGACA TCTTCACCAC GGCGCCGAAA 
ACGGTGGCCG AGATCGAGGA AGTCATGCGC CATGACTGA

Protein sequence

MTHAHFLARR KRLLKTIGDG VAIVPTAPEV IRNRDAHHLY RFDSYFWYLT GFPEPEAVVV 
LIGGKKPKSI LFCREKHEER EIWDGYRYGP KAAKTAFGFD AAYPIEQLDK KLAEFLVDRD 
TLWHAIGHDA EWDARIAKAL NEVRAQTRAG KRAPRAIHDL RAELDGMRLV KDSAEAGIQQ 
RSADIASAGH ARAMRACRPG MAEYELEAEL TYEFRKRGAD AHAYTPIVAG GTNACVLHYV 
SNDKVLNDHT LVLIDAGCEV DGYAADITRT FPVNGRFNPA QKDVYEIVLA AQTAAVAATA 
PGRHFMEGHD AAVRVLTQGL IDLKLLTGNL DNLIEKGDYK RFYMHRTGHW LGLDVHDAGE 
YKVGDAWTTL QPGMTLTVEP GLYIRPGTDI PPALAGIGIR IEDDVRVTEN GCDIFTTAPK 
TVAEIEEVMR HD