Gene Apar_0831 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0831
Symbol
ID	8413697
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	918794
End bp	920035
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	49%
IMG OID	645022414
Product	NusA antitermination factor
Protein accession	YP_003179851
Protein GI	257784634
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000000351407
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000000535814
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCATCTG AAATGATGGA AGCTTTGATG TTGCTTTGCC AGGAAAAGCA CATCGATGAG 
TTGTATTTAC TGGATCGTTT GGAGCAGTCT CTGGCAAAAA GCTATGCTGA TGTCCTCCAC 
CTTGATTTTG GTGCTCGCGT CACTATTGAT AGGGCTACAG GCCGTGTATA CGTTTATGAG 
CTTGTTCCTA AGGGCGAGCC AGATGAGGAG ACTGGTGAGT ACACCGAGTT TGATGAGGTA 
GATGTAACTC CTCCTGATAC GAGCCGTATT GCTGCTCAGC ATGCTAAGGC AGAGATTAAG 
ACGCTTGTTC GTAATGCTGC TCGTGCTCAG ATTTATGATG AGTTCCGTGG TCGCGTTGGT 
GACATCATTA CTGGTACCGT TCTCCAGTCC ACTCCTGATT TCACCATCAT TAAGATTCGT 
GAGGGTGTAG AGGCAGAGCT TCCACACTTT GACCAGCGTC GTTTCCCTGA CGAGCGTGAT 
GAGCGTCCAG CAGGAGAGCG TTATCTACAC AATCAGCGCA TCAAGGCAAT TATTGTTGAC 
GTTCGTGATC CTAATGCAAC TCAGCCAGCA GTTCGTGGTG AGCGCCAGCG TCCACCAATT 
GTTGTCTCTC GTACCCACCC AGATCTTATC CGTCGTCTCT TTGAGCTTGA GGTCCCAGAG 
GTTTATGACG GTGTAGTGAG CATTCGTTCT ATTGCTCGTG AGGCTGGCGT TCGTTCTAAG 
ATTGCTGTTT CTTCCGTTGA TGAGCGTCTT GATCCTGTTG GTGCTTGTGT TGGTCCTAAG 
GGCAGCCGTG TTCGTACCGT AGTTTCTGAG CTCCGCGGGG AGCGCGTTGA CGTTGTACCT 
TGGTTTGATG ACGCTGCTCG TTGTGTTGCC TCCGCACTTT CACCTGCACG TGTTTCTCGC 
GTTATTGTTG ATGGCGCAAC TGGTCACGCA ACCGTTATTG TTCCTGATGA TCAGCTATCT 
TTGGCTATTG GTAAAGAGGG TCAGAATGCT CGTCTTGCTG CTCGTTTGAC TGGTCTTCAC 
ATTGACATCA AGAATGAGTC CCTTGCTGCA AACATTTTGA ACAACCTTCC TGAGGTTGTT 
GAAGAGGCTG TTGACGAGGA AGAGATTGCT CATCGTTGCA AGTATGTGAG CCCTAGCGGA 
GTTCCTTGCC GCAATATGGC AAGACCTGGT TCTGATTTCT GCGGCATTCA TGATGCCATG 
GAGAATGCAG AGATTTCTTC TGATTCAGAC TCATTGATTT AG

Protein sequence

MASEMMEALM LLCQEKHIDE LYLLDRLEQS LAKSYADVLH LDFGARVTID RATGRVYVYE 
LVPKGEPDEE TGEYTEFDEV DVTPPDTSRI AAQHAKAEIK TLVRNAARAQ IYDEFRGRVG 
DIITGTVLQS TPDFTIIKIR EGVEAELPHF DQRRFPDERD ERPAGERYLH NQRIKAIIVD 
VRDPNATQPA VRGERQRPPI VVSRTHPDLI RRLFELEVPE VYDGVVSIRS IAREAGVRSK 
IAVSSVDERL DPVGACVGPK GSRVRTVVSE LRGERVDVVP WFDDAARCVA SALSPARVSR 
VIVDGATGHA TVIVPDDQLS LAIGKEGQNA RLAARLTGLH IDIKNESLAA NILNNLPEVV 
EEAVDEEEIA HRCKYVSPSG VPCRNMARPG SDFCGIHDAM ENAEISSDSD SLI