Gene Apar_0187 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0187
Symbol
ID	8413035
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	219727
End bp	221418
Gene Length	1692 bp
Protein Length	563 aa
Translation table	11
GC content	53%
IMG OID	645021759
Product	cell envelope-related transcriptional attenuator
Protein accession	YP_003179214
Protein GI	257783997
COG category	[K] Transcription
COG ID	[COG1316] Transcriptional regulator
TIGRFAM ID	[TIGR00350] cell envelope-related function transcriptional attenuator common domain

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.234515
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAGAA GGTCACATTC ATCTCAGAAT CGCGGTCGCA ACAGCCGTGA TAGATACGAA 
GATACCCCTG AGTACGATAC AGAGGACTTC GCACAGGACG ATTATGACGC ATATGATCAG 
GGTGGCTATC AGCCTCGTAC GCTGGGCAGT GTTCGAAGTG CTGGTGCTAG CTCTGCTCGC 
AATAATCACG CAGAATCTCA CGGATCCAGG TTTACTCGCG AGCCGTTGAT TGGCCAGACC 
AATGTGGGTG ACGAGTGGCC AGAGGATAAC CCTGCTACGC AGCCAAGAAA CGCCCGCTAT 
GCATCACATC GTGCTGGCGC CGTCAGCCAT GCTCCTTCAC GTGCTGAGGG CGTTGGTGCG 
TATTCCAAGA AGCGCCAAGG ATCTTCTCGC GGTCGTGGCC TTAAGATTTT TGGGGGCATC 
CTGGGAACGT TGCTACTGGT AGCAGGTATA GCGTTTGCCT GGTGGATGTT AGATACCAAC 
TCAAAACTCC GTCAGGGTCT GGACGCAAAC TTGCAGGCTA CGCTGGTACA AGTTGCTCCA 
TCTGATCCAT TCTACATGCT GCTTCTTGGC GTGGATAAGG ACGAGGGACG CGCAGAGAAC 
TGGGGTGATT CCAACGCAAA CTTCCGCGCC GACACTATCA TTCTTGCCCG CGTAGACCCA 
AAGAACAAGA AAATTACGTT GATTTCTATT CCACGAGACA CTATGGTTGA CCTGGGAGAA 
CACGGAAAAC AGAAGATTAA CTCCGCGTAC AGCTACGGCG GTGCGTCCGG AATGGTCGAA 
GCCGTTTCCA AACTGGCAAA CGTTAATATC TCGCACTATG CCGAGGTAGA CTTTGAGTCA 
TTCACCAAAA TTGTGGACTC CATTGGCGGT ATTACGGTCA ACCTGCCCGT AGCTGTTTCC 
GACATGCAAT ATTCTGGCAT CGATCTACCC GCGGGAGAGC AGCAGCTTAA CGGACAGCAA 
GCACTTGGCC TTTCTCGCAG TCGCCACGCG TACGACAATT ACGGCGCCGG CGACTTCTAC 
CGTGCGGCTA ACCAGCGCAT GATTTTAACG GCTATTGCCA AGAAAGTCCT AAAGCTGGAT 
CCTGTTTCTA TGTCGGGAGC TGTTTCCACC ATGGCTGAAA GTGTAACCAC CGACTTTAAC 
GTTACCGATA TCGTAGGCTT AGCTATGTCT TTAAGAGGCC TGGACACCTC CAAGGATATG 
TATTCCGCAC GTACGCCGAC AACGTCTGAG CTTATCGATG ATGTCTGGTA TGAGATTGTT 
GATAAGGACG CGTGGAAGAC CATGATGGAC CGCGTAAACC AGGCGCTGCC TCCTCTGGAA 
GATGCAAGTA CCGATGAAAC CACAGGTATT GCTGGTACCG TTGCAGGTGA CGCTTCCGCA 
ACCGACAACA TTAAGCCGGA CTACACCGGA GAAGTTGCCG TACTCAACGG TACCGATGTT 
CAAGGACTTG CAGCTCAGAA GGCTGGCATC CTGAAGACAA AGGGTTACAC CGCCTACGCC 
GACAGTTCGC AAGAGCATCC AAGCAACTCG ATTATTGTCT ACGACGGCAC ACGCACAGGC 
CTGGCTAAGG CTGTTGGTGT TGCAAAGGCG CTAGACATCC CTACTGCAAA CATCAAGGCA 
AACGACGGTA CCTACCCCAC TGACACGGAC ATTACCGTGG TCCTAGGCAC CGATCAGGCA 
CCAAAGCGTT AA

Protein sequence

MARRSHSSQN RGRNSRDRYE DTPEYDTEDF AQDDYDAYDQ GGYQPRTLGS VRSAGASSAR 
NNHAESHGSR FTREPLIGQT NVGDEWPEDN PATQPRNARY ASHRAGAVSH APSRAEGVGA 
YSKKRQGSSR GRGLKIFGGI LGTLLLVAGI AFAWWMLDTN SKLRQGLDAN LQATLVQVAP 
SDPFYMLLLG VDKDEGRAEN WGDSNANFRA DTIILARVDP KNKKITLISI PRDTMVDLGE 
HGKQKINSAY SYGGASGMVE AVSKLANVNI SHYAEVDFES FTKIVDSIGG ITVNLPVAVS 
DMQYSGIDLP AGEQQLNGQQ ALGLSRSRHA YDNYGAGDFY RAANQRMILT AIAKKVLKLD 
PVSMSGAVST MAESVTTDFN VTDIVGLAMS LRGLDTSKDM YSARTPTTSE LIDDVWYEIV 
DKDAWKTMMD RVNQALPPLE DASTDETTGI AGTVAGDASA TDNIKPDYTG EVAVLNGTDV 
QGLAAQKAGI LKTKGYTAYA DSSQEHPSNS IIVYDGTRTG LAKAVGVAKA LDIPTANIKA 
NDGTYPTDTD ITVVLGTDQA PKR