Gene Apar_1261 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_1261
Symbol
ID	8414140
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	1414174
End bp	1415148
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	39%
IMG OID	645022853
Product	sortase family protein
Protein accession	YP_003180277
Protein GI	257785060
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3764] Sortase (surface protein transpeptidase)
TIGRFAM ID	[TIGR01076] LPXTG-site transpeptidase (sortase) family protein

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTAATC CAAAACACAT GATGGCTGTA TTGAAAGCAG GAGAATCAAA CGATTCTCCT 
GCTTCTCTTA ATGCCTCGGA TAAAGGTATA GAAAAAAAGA AGCGTGCGCG CGTATGGCTA 
ATTATGTCGA TTATTGTTTT GGTTGCTGGT GTTGCGTTAA TTAGCTATCC ATTTGTAAGT 
AACTGGCTTA ACCAACTTAC TCAAAATAAT GTGAGTGCTA CCCAAGAAAA TACAGTAGTT 
ACAATGTCTA AGACAGACCT TTCTTCTGAA AAGGAAAGGG CAATTGAATT TAATAAGCAC 
CTTCGTGATG GTGCTTCTAG GGTTATTGAC CCCTTTGATA GCAAAGAATC TATGCCAGGG 
GTTACTGAAT ATAAAGAAGT GCTGAACATA GCAAATGATG GTGTTATGGG AGAGCTTATA 
ATACCAAAAA TTTCAGTGAA TCTTCCTATT TATCACTTTA CAACTGATGA TGTGTTACAG 
CATGGTGTTG GTCATGTAGT AAATACTTCT GTGCCAATAG GCGGGGAGTC AACGCATACT 
GTTTTAGCAG GTCATACCGG TCTGCCTACC GCCCGTATAT TTGATCGACT CAATGAACTT 
CAAGCAGGTG ATTGGTTTAT TATTCATGTT CTTGGGGAAG ATCATGCGTA TAGAGTAACT 
TCTACTGAAG TAGTTTTACC TAATCAGGTA GATAGTCTTT TTATTGAGCC AGGGAAAGAT 
CAAGTAACGC TTGTAACGTG TACTCCTTAT GGTGTTAATA CTCATAGGTT ATTAGTACAT 
GCAGAGCGCA CGGATGTTCC TGCCGAATGG AACGATCAAA ATGAGTTGAC TAATCGTTCC 
ATTGATTCTT CGGTAGATAT GAGTCGACAC CCAATATTAT TCTCTATTTT GGGTATTGTA 
TGTGCTGGTG TAGTTGTCAG TATTGCGGCT TTTATCGCTA AACGTACAAA AGTTTTTTCA 
AAAATAAAGA AGTAA

Protein sequence

MANPKHMMAV LKAGESNDSP ASLNASDKGI EKKKRARVWL IMSIIVLVAG VALISYPFVS 
NWLNQLTQNN VSATQENTVV TMSKTDLSSE KERAIEFNKH LRDGASRVID PFDSKESMPG 
VTEYKEVLNI ANDGVMGELI IPKISVNLPI YHFTTDDVLQ HGVGHVVNTS VPIGGESTHT 
VLAGHTGLPT ARIFDRLNEL QAGDWFIIHV LGEDHAYRVT STEVVLPNQV DSLFIEPGKD 
QVTLVTCTPY GVNTHRLLVH AERTDVPAEW NDQNELTNRS IDSSVDMSRH PILFSILGIV 
CAGVVVSIAA FIAKRTKVFS KIKK