Gene Apar_0293 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0293
Symbol
ID	8413141
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	338589
End bp	339836
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	50%
IMG OID	645021860
Product	amidohydrolase
Protein accession	YP_003179315
Protein GI	257784098
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.356604
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAAGT ATGCTTTTGT AGGCGGCAAG CTCGTTGACG GTACTGGCTC TGCACCAGTT 
GAGGACTCTC TTGTCCTTAT TGATGACGAC AAGATTACCT ATGCTGGTCC TCGTAAAGAG 
GTTCCAGAGG GATATGAGGT ACGTGACGCA TCCGGTTATA CCGTAATGCC TGGTCTTGTT 
GATACACACC TACACTTCTC CGGTAACCTG ACCGACAACG ATAACGATTG GGTTATTGAG 
TCCGTTGCTC AGAAGCAGGC ATGCGCAGTC AAACAGGCTT ATGACGCTCT TACCCACGGT 
CTTACCACTG TTGTTGAGAT TGGTCGTAAT GGTATTGCTA TCCGTGACCT CGTTAACATG 
GGCATTATGC AGGGTCCTCG TATCTTTGCT ACCGGTCTTG GTCTTTGCCG CGTTGCTGGT 
CACGGTGACT CTCATCACCT GCCATTGCAG ATCTCCAAGG ACGGACACCC TTGGGGTGAC 
CAGGTAGACG GTCCATGGGA GCTTCGTAAG GCAATTCGTC GTCGTCTTCG TGAAGATCCT 
GATGGTATCA AGATTTGGGC AACTGGTGGC GGCATTTGGC GCTGGGACTC TGACCGTTTG 
CAGCTCTTCT GCACCGAGGA AATTAAGGCA ATTGCTGACG AGTGCGCACT GGTAGGTATT 
CCTCTTTACG CTCACTCTTA TAACAACTTT GACGCTGCGT ATGACTGCGT CCGCTTTGGC 
TGCAAGCAGC TCATTCACGG CTTTGAGATT GACGAGCGCA CCATGAAGCT TATGGCTGAG 
CAGGGTACCT TCTTTACCCC AACTATCGGC TTCTTGCCAA CTTGGTACGG AACTTATCCA 
CCAGACTGGA CTCCAGAGCT TGATGCATTC CCAGGTGAGA CTGTTGTCGA GAAGGGTCTT 
GCACGTACCT ATGATAACCT GCGTAAGGCA TATGATATGG GCATTACCAT TACCATTGGT 
TCCGACTCCT TCAGTTTTGT TACTCCTTAC GGCTATGTCA CCATCGACGA GATGTATGAC 
TTTGTCGAGA AGGTTGGCAT TTCTATTCTT GATACCGTTG CAGCTGCTAC TTACAACGGC 
GCAAAGATGC TGGGCAAGGA GAACGAGTTT GGTGCTGTCA AGGAAGGCCT CTCTGCTGAT 
ATCCTTGTAG TTAAGGGCGA CGTTGCTAAT AACATCCGCG ACCTCACGCC TGAGAACATG 
GACGTCATCA TGAAGGAAGG TAAGATTATC GATCGCGGTA GCTTCTAA

Protein sequence

MSKYAFVGGK LVDGTGSAPV EDSLVLIDDD KITYAGPRKE VPEGYEVRDA SGYTVMPGLV 
DTHLHFSGNL TDNDNDWVIE SVAQKQACAV KQAYDALTHG LTTVVEIGRN GIAIRDLVNM 
GIMQGPRIFA TGLGLCRVAG HGDSHHLPLQ ISKDGHPWGD QVDGPWELRK AIRRRLREDP 
DGIKIWATGG GIWRWDSDRL QLFCTEEIKA IADECALVGI PLYAHSYNNF DAAYDCVRFG 
CKQLIHGFEI DERTMKLMAE QGTFFTPTIG FLPTWYGTYP PDWTPELDAF PGETVVEKGL 
ARTYDNLRKA YDMGITITIG SDSFSFVTPY GYVTIDEMYD FVEKVGISIL DTVAAATYNG 
AKMLGKENEF GAVKEGLSAD ILVVKGDVAN NIRDLTPENM DVIMKEGKII DRGSF