Gene Apar_0221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0221
Symbol
ID	8413069
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	259801
End bp	260922
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	39%
IMG OID	645021789
Product	protein of unknown function DUF1648
Protein accession	YP_003179244
Protein GI	257784027
COG category	[R] General function prediction only
COG ID	[COG4194] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.263537
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.853287
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACATCA TTTCAATTAG TGCACAGACA ATAGTAACGT TTGTAGTTGG ATTATTTCTT 
ACTTTCATTC CGTATATAAC ACGCCATAAC GAGTGTTTTG CTGTGACGGT ACCAGTTTCT 
GCTCAAAAAG ATTCACGTAT GATTTCTTTA AAGAAACGCT ATGTTGTGGA AATGCTTCTT 
ACAACAATAC TAGCAACCAT TTCTTCTGTG ATAGCAGGGA AGTTACTAAC AACTAATCAA 
ACTATAGCCG GCTTAACTCT TCTATATAGT GCTTTAGTGA TTCCTGCAAT TGTCTCTTTT 
GTGTTAATGT TGCATGCCCG TTCTAAGGTA ATAGCCCTTA AGAAATCTGA AGGTTGGGAT 
TTCGAGCAAC ATAAGATGAC TGCTAGTGTT GTCGAAAAAG ACTTCCCGAA TCCAATCTCT 
TTAAGATGGA ACCTTATGTA TATTCCTATT ATTTTGGGAA CAGTTTGCTT GGGATTTGTT 
CTTTATCCGA GTATGCCTGA TATGTTGCCT ATGCACGCCG ATTTCACAGG AACAATTGAT 
AGCTACACGC CAAAAACGTT TGGTAGTGCC CTTGGATTTC CTGTTGCATT TGAAGTCTTC 
ATGGCGGCAT GCTTTATCTT TTCTCATTGG ATGATTGTGC ATTCAAAACA TGCGGTTGAT 
CCTAGTGAGC CAGCTACTTC TGCATTTTCA TATGGAGTTT TTGCTCGTGC TCAGAGCATA 
TTTCTCTTCA TAATAGGCTT ACTTATAAGT GGCGGTCTTG GTGTTTTGTT TATTCTTGCA 
TCAGCAGGGC GTATTAGTCT TGGACAAGTG GGATTTATCG CTGAAATTTT TGCTGTGCTT 
ACCGTCGTTG GTATTTTGGT ACTTTCAGCT GTCTATGGTC AGTCAGGTTC ACGAGTATTT 
AGGAAGTTAG ACCACAACGA GAACTACCTA TCAGATGAGG ATAGACATTG GAAACTTGGC 
GTCTTTTATT TTAACCGTGA AGATGCAAGC ATCTTTTTAC CAAAACGATT TGGTGTTGGA 
TGGACTATGA ACTTTGCACG ACCAGCTGTT TGGGTAATTA TCGTGGGTCT TATTATTTTT 
CCTATAGTTT TTGTTGTACT TGTTTCTTAT TTGGCGGGGT AA

Protein sequence

MDIISISAQT IVTFVVGLFL TFIPYITRHN ECFAVTVPVS AQKDSRMISL KKRYVVEMLL 
TTILATISSV IAGKLLTTNQ TIAGLTLLYS ALVIPAIVSF VLMLHARSKV IALKKSEGWD 
FEQHKMTASV VEKDFPNPIS LRWNLMYIPI ILGTVCLGFV LYPSMPDMLP MHADFTGTID 
SYTPKTFGSA LGFPVAFEVF MAACFIFSHW MIVHSKHAVD PSEPATSAFS YGVFARAQSI 
FLFIIGLLIS GGLGVLFILA SAGRISLGQV GFIAEIFAVL TVVGILVLSA VYGQSGSRVF 
RKLDHNENYL SDEDRHWKLG VFYFNREDAS IFLPKRFGVG WTMNFARPAV WVIIVGLIIF 
PIVFVVLVSY LAG