Gene Apar_1234 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_1234
Symbol
ID	8414113
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	1385749
End bp	1387068
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	50%
IMG OID	645022827
Product	hypothetical protein
Protein accession	YP_003180251
Protein GI	257785034
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000907369
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGTACA CAAGAAGAGA TGTAGTAGCC GGTCTTCCAG TTTTGATGGC ATTCGGACTT 
GCTGGTTGCA AAACCGCAAA AGCAACCGCT AATAACACAA CTGAAGACAC CAAGAAGGCT 
TCAGAAGCAC TTCGGATTAC CGCCGCTCAG ACCCTGGATG GCTATGCAGT AAACAGCACT 
ACTGCTGATG AGAATACCAT CCTGGTCAAT ACTACCGACG ATGTAACCAT TACCAATTCC 
ACGGTTACTA AGACAGGAGA TTCCGACGGC GGAGATAACT GTAACTTCTA CGGTCAGAAC 
GCTGCAGTAC TTGTTGAGGG AGGTTCAACC ACTACGCTGA CTAACCTCAC TGTTACTTCA 
GATGCAAAGG GTGCCAACGG CATTTTTAGC TACGGAGGCA ACGGCGGTCA GAACGGCGGT 
GACGGTGATG GCACCAAGGT TATTATCAAG GACACCACCA TCACTACAAC TGGCGACGGC 
GCGGGTGGCA CCATGACAAC CGGTGGCGGC ACCACCAATG CCTACAACCT CACGGTTACC 
ACAAACGGTC AGTCTTCTGC AGCTATTCGT ACCGATAGGG GCGGCGGAAC AGTTTACGTA 
GACGGTGGTA CCTATACCTC CAATGGTCTA GGTTCGCCAG CCATCTACTC CACGGCAGAG 
ATCCACGTTG CTAACGCCAC ACTTGTTTCT AACCTTTCCG AGGGCGTTTG TATTGAGGGC 
TTGAACTCCA TTGAGCTTAC CGATTGCGAC CTTACGGCAA ACAACACCAA GTGCAATGGC 
AACGCAACCT TCATGGACAC CATCATGATT TACCAGTCCA TGTCCGGAGA TGCAGCAACA 
GGTAATTCCA CCTTTGCTAT GACTGGTGGT TCCCTCACCA GCAAGAACGG TCACATGTTC 
CACGTTACTA ACACTAACGC TGACATTGAG CTCAATGGCG TCAAGTTAAC TAACGAAGAC 
GCTGCTAACA TTCTTATCTC TGTCTGTGAT GACGGTTGGA ATGGCGGTAA TAATAAGGCA 
ACCTTTAACG CTAAAGCGCA GGATCTGGTG GGAGCGGTGC TTGTTGGCAA CAACTCCACA 
CTTGCTCTGA ACCTTACCGA AGGAACCACG TTTGAGGGTT ACGTTAACGG CAACATCGTC 
AACGCCACTA ACCAGACTGT TTCCACTGAA GTTGGTACTG TTGCGGTAAC ACTGGATAAC 
AACAGTACTT GGACTTTGAC AGCAGATAGC TATGTCACCG AGTTCAATGG TACTGCAGCA 
AACGTTATTG CTAACGGTCA CACACTGTAT GTAAAAGGTA CGGCACTCAC GGGAACCTGA

Protein sequence

MQYTRRDVVA GLPVLMAFGL AGCKTAKATA NNTTEDTKKA SEALRITAAQ TLDGYAVNST 
TADENTILVN TTDDVTITNS TVTKTGDSDG GDNCNFYGQN AAVLVEGGST TTLTNLTVTS 
DAKGANGIFS YGGNGGQNGG DGDGTKVIIK DTTITTTGDG AGGTMTTGGG TTNAYNLTVT 
TNGQSSAAIR TDRGGGTVYV DGGTYTSNGL GSPAIYSTAE IHVANATLVS NLSEGVCIEG 
LNSIELTDCD LTANNTKCNG NATFMDTIMI YQSMSGDAAT GNSTFAMTGG SLTSKNGHMF 
HVTNTNADIE LNGVKLTNED AANILISVCD DGWNGGNNKA TFNAKAQDLV GAVLVGNNST 
LALNLTEGTT FEGYVNGNIV NATNQTVSTE VGTVAVTLDN NSTWTLTADS YVTEFNGTAA 
NVIANGHTLY VKGTALTGT