Gene Apar_0108 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0108
Symbol
ID	8412951
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	122006
End bp	123190
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	49%
IMG OID	645021675
Product	aspartate aminotransferase
Protein accession	YP_003179135
Protein GI	257783918
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.301084
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCAATC AGACAAGTCT TGCATACGGA ACAGAAAAGT CTGCAATCCG TGAGATTGCG 
GGTTACGCAG CGCAGCGCCG TGCTGAGATT GGCGCTCAGA ATGTGTTTGA TTTCTCGATT 
GGTAACCCTT CAGTCCCTGC TCCCGAGGCT GTTCGTACCT CTATCGAGGC TGCTATGCAG 
CTGCCTCCAC AGCAGGTTCA CAGTTACACT CCTGCAGTTG GCATTCCTCA GGCTAGGGAG 
GCAATTGCTG CGTCGTTACG ACGTCGTTTT GGAAACTACG CAGCTCAGGC GGATGACCTT 
ATTTTGACTT GTGGAGCCGC GGCTTCTGTT TCTATGGCAA TCAATTCTAT TGTTTCCCCA 
GGTGAAGAGG TTATTGTCAT TGCACCATAC TTCCCGGAAT ATCGCGTATG GATTGACCAT 
GCTCAAGCTA CTTGTGTTGA GGTTTTAGCT GATAAGAAAA CCTTCCAAAT TGATATTGAT 
GCTGTTTGTT CAGCTATTAC GCCTAAGACT CGTGCGGTGA TTATCAACTC TCCAAATAAT 
CCTGTTGGCG CTGTGTACAC TAGGGAAAAC CTGGATGCAT TTGCTGATAT GCTCCGCAAA 
CGCTCTTCTG AGTTGGGTAC TGACATCTAC GTTATTTCAG ATGAGCCTTA CCGCGAGATT 
GTCTTTGGTG ATATTGAGGT TCCTTGGGTT CCAGATGTCT ACGAACGCAC CATTGTGTGC 
TACTCCTATT CAAAGTCCCT CTCGCTTCCT GGCGAGCGTA TTGGTTGGGT GTTGGTACCT 
GCGTCTAATC CAGAGCAGAA GGAGATTTAC GCAGCTTGTG CGGGCGCTGC TCGTTTGCTG 
GGCTTTGTGT GCGCGCCAGC CCTTTTCCAG CGCGTTATTA TTGACTGTGT TGATGAGCCA 
GCAGATGTTG AGGCTTATGC AAAGAATCGA GAAGTTCTGA CTGATGGTTT GACCAAGCTT 
GATTACGAGT ACATCCAGCC TGATGGCGCA TTCTATCTGT GGGTTCGTGC TCCTGGTGGA 
GATGCTCAGG CATTCTGTAA TGTTGCTAAG CAGTTTGAAC TGCTCCCTGT TCCATCTGAT 
TCATTCGGTT GCCCAGGATG GCTGCGTGTG AGCTACTGTG TTGCATATCA GACTTGCGTT 
GATTCACTTG CTGCCTGGGA AAAGGCACTT GCTGCAATGA AATAA

Protein sequence

MVNQTSLAYG TEKSAIREIA GYAAQRRAEI GAQNVFDFSI GNPSVPAPEA VRTSIEAAMQ 
LPPQQVHSYT PAVGIPQARE AIAASLRRRF GNYAAQADDL ILTCGAAASV SMAINSIVSP 
GEEVIVIAPY FPEYRVWIDH AQATCVEVLA DKKTFQIDID AVCSAITPKT RAVIINSPNN 
PVGAVYTREN LDAFADMLRK RSSELGTDIY VISDEPYREI VFGDIEVPWV PDVYERTIVC 
YSYSKSLSLP GERIGWVLVP ASNPEQKEIY AACAGAARLL GFVCAPALFQ RVIIDCVDEP 
ADVEAYAKNR EVLTDGLTKL DYEYIQPDGA FYLWVRAPGG DAQAFCNVAK QFELLPVPSD 
SFGCPGWLRV SYCVAYQTCV DSLAAWEKAL AAMK