Gene Apar_1090 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_1090
Symbol
ID	8413963
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	1232791
End bp	1234344
Gene Length	1554 bp
Protein Length	517 aa
Translation table	11
GC content	49%
IMG OID	645022679
Product	PSP1 domain protein
Protein accession	YP_003180109
Protein GI	257784892
COG category	[S] Function unknown
COG ID	[COG1774] Uncharacterized homolog of PSP1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.220883
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCACCG TTGTCCCGGT GAAATTTGAA TACGCCGCAC GCGACCTTTG GTTTGATCCA 
AAGGAGTCTG GCGTTCTTGA AGGCGACCAC GTCATTTGTC AGACTGAGCG TGGTCTAGAG 
ATTGGCCTTG CTATTGCTGA TCCTCGTGAA ATTTCTCAGG AGGAGTTTGA ATACAAGACA 
AACAAAGCTG AGCTTAAAGA TGTTGTTCGC GTAGCAACTG AAGAAGATCT TTCTCGCGCA 
GAAGAACTTG CCACTAAGGG CGAGGCTGCG CTTCCCATAT TCAGGAAGTT TGTTGTTCAA 
GAAGAACTTG AGATGAAGCC TATTGGCGTT GAGTATCTTT TTGATGGCGA GAAGGTCGTT 
TGTTACTTCT CAGCTGATGA TCGTGTGGAC TTTAGACAGC TTGTCCGTGA GCTTTCTCAT 
GAACTTCATG AGCGTATTGA TATGCGTCAG ATTGGCGTCA GAGAAGAGGC GGCGGTCATT 
GGTGGCTATG GTCACTGTGG ACAAGAGCTT TGCTGTAGAA GGTTTGGTCT TTCTTTTGAG 
CCAGTTTCTA TTCGTATGGC AAAAGAGCAG GATTTGCCAC TGAACTCCAC TAAGATTTCT 
GGTGCTTGTG GCCGCTTAAT GTGCTGCTTG CGCTATGAGT TTGAAGCGTA TCGTGATTTT 
AAGAACCGTG CTCCAAAGCG TAATGCTGTT ATTGAGACTC CTTTGGGTAT GGCAAAAATT 
GTTGAGTACA ACACACCAAA AGAAGAGATT GCACTTCGTC TTGAGAGCGG CAAAGTAGTC 
CGTATTCCTC TTGCTGACAT GGATGCATCT CCTGCAGCAC AGCAGAAGTC GGATGAGCTA 
GGTTGTTCTT GCAGACCAGA CAGTGTTTCT CGCGCTGCAC TTGAGCGTCT TGAATCTGTT 
GAGGTTCAGA TGGCCCTGGC AGAACTTGAT AAAGCAAACG GTTTGATAGT TGATGAAGAG 
CCAGAAATCA ATCCTGACCT CTTTGTTACT GAGGCTCCAA GACGCAAACG TGAGCGCTTT 
GAGCAGAGCA ATGCAAATAG GCAGGAAAAT GCGCAGAAGT CTAGCGTAAG AAACACTCGA 
GAAGAACAGG GTACTCAAAG CTCTTCTCGC ACCCGTCGTG TAAGAACCTC AAAGAATGCT 
CAAGTAAACC CTGGTTCCAG TACTTTTGAT GCCGCAACTG ATACACTGCG TCGCACGCGT 
CGCCGTCATC ACGTAACAGA CGATGGTGTC ACAAACACTC AGACACCCCA GAAGAACGAG 
CAGAACTCAG CTTCTGCTCA GAAACAGCCT CAGGGCAAGC GTTTTAGAAG GACAGATGCT 
CCTCAGAGTG CACAGAGTGC CGATGAGACT CAGGCTCCGG TCCGTACAAA GAGAACTCGC 
CGTCCAGGCG ATAGGGCGGG CATGAAGGCC CAAAGTTCTT CACAGAGTGC TTCTGGCTCT 
GGCAGTGCAC CTAATGCTGG ATCTGTAGAC GCTCAGTCAC AGAATGCTAC GCGTCGTAGA 
CATAGAAGAG CTGGGCGAGA TAATCGTAGC CGCGGTTCAA AGGACAATGC GTAA

Protein sequence

MPTVVPVKFE YAARDLWFDP KESGVLEGDH VICQTERGLE IGLAIADPRE ISQEEFEYKT 
NKAELKDVVR VATEEDLSRA EELATKGEAA LPIFRKFVVQ EELEMKPIGV EYLFDGEKVV 
CYFSADDRVD FRQLVRELSH ELHERIDMRQ IGVREEAAVI GGYGHCGQEL CCRRFGLSFE 
PVSIRMAKEQ DLPLNSTKIS GACGRLMCCL RYEFEAYRDF KNRAPKRNAV IETPLGMAKI 
VEYNTPKEEI ALRLESGKVV RIPLADMDAS PAAQQKSDEL GCSCRPDSVS RAALERLESV 
EVQMALAELD KANGLIVDEE PEINPDLFVT EAPRRKRERF EQSNANRQEN AQKSSVRNTR 
EEQGTQSSSR TRRVRTSKNA QVNPGSSTFD AATDTLRRTR RRHHVTDDGV TNTQTPQKNE 
QNSASAQKQP QGKRFRRTDA PQSAQSADET QAPVRTKRTR RPGDRAGMKA QSSSQSASGS 
GSAPNAGSVD AQSQNATRRR HRRAGRDNRS RGSKDNA