Gene Apar_0567 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0567
Symbol
ID	8413421
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	642899
End bp	644074
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	44%
IMG OID	645022139
Product	integrase family protein
Protein accession	YP_003179588
Protein GI	257784371
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.563798
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00485057
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACCGCT CAATAAAAGT TCGATTGAAT TCGAACGGCA TTTGGTGCTG TAGGCTTTAC 
TTAGGAAGAA ATCTTAACGG CAAAATCATT CAGCCTTATG CAAGCTTTCC TACGGCAAAG 
ACGCAGAAAG AAGCTGAAGA ATTAGCCACT ATGTGGGCGT CTCATATTAC GTCTGACGGC 
AAAGTTAAAA GCACACAGCT TACCGATTTA CTTCTCGAGT ATGTTTCTAT TAAACGCAGG 
AATGGCGCGA GCCCTAACAC TACAAGGCAG CATGAAGGCT TCATTAGAAA CCATATCAAT 
GGAAGGCTTG GTAAAGAGGA TGTAAGAAGT ATTACATCCT CTTTATTCAC TTCATTTGAG 
CAGGATTTAT TGAAGAAGGG TTTGTCTCGA AACAGTGTAA TTAACCTGCA TCAATTCTTG 
AGAGGTGCAT ACAATTACTT TGTTTCAGCT GGCATATGCG ACTATAACCC GCTTATTAAC 
GTGGCTAAGC CGTCCAGGGA AGTCCATGAA GCTGTATCCA TTGAAGAATG GGGTTTTGCT 
GGGATAAGTA CCCTTATTAA TTCCAGGATT ACTACAGCCA TTCAAGAGGA TGAGTTTAAT 
TCCCGTGTTG TTTGTGCCTT TGCTGCTTGG CTGTCTTTAG TAACTGGTAT GCGCTGCGGT 
GAAGTTTGTG CTATTAGATA CAGTGATGTA AACATGCTAT ATAAGCATAT CCACGTATCT 
GGTACCGTCA TTGAAGAGTC TTACAGAAAG CCTTATAGAC GAGAATCAAC CAAGGGTAAG 
AGATCTAGAA ACATAGCCAT TACAGACTCG GACATCAGTT TTATTAGTGA CTACATGAAG 
CTTCAGCAAG CTCATATTGC CTTTGTGGAG TCTTCTACAC CGTTAATTAG CCTTGATGGC 
TCTTACATGC GTCCAACGAG CGTTTCGAGG TCATTTACAC GCATGAGACG CACTCTCCAG 
CTACCTCAAG GCATTACCTT CCACTCACTC AGACATACTC ACGCGTCTTG GTGTTTGGCA 
AGTGGCGTTG ACTTAAAGAC TCTTTCAGAG CGTCTTGGCC ACGCAGACCC AGCAACAACT 
TTGAGGATTT ATTCTCATTT GCTGCCTGGA CGTGACCGGG GAGCGGCAGA AGCGTTTGGA 
GACGCGCTTA GGACCATTGA ACAAGGAGCG TTCTAA

Protein sequence

MNRSIKVRLN SNGIWCCRLY LGRNLNGKII QPYASFPTAK TQKEAEELAT MWASHITSDG 
KVKSTQLTDL LLEYVSIKRR NGASPNTTRQ HEGFIRNHIN GRLGKEDVRS ITSSLFTSFE 
QDLLKKGLSR NSVINLHQFL RGAYNYFVSA GICDYNPLIN VAKPSREVHE AVSIEEWGFA 
GISTLINSRI TTAIQEDEFN SRVVCAFAAW LSLVTGMRCG EVCAIRYSDV NMLYKHIHVS 
GTVIEESYRK PYRRESTKGK RSRNIAITDS DISFISDYMK LQQAHIAFVE SSTPLISLDG 
SYMRPTSVSR SFTRMRRTLQ LPQGITFHSL RHTHASWCLA SGVDLKTLSE RLGHADPATT 
LRIYSHLLPG RDRGAAEAFG DALRTIEQGA F