Gene Apar_0817 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0817
Symbol
ID	8413682
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	898343
End bp	899371
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	46%
IMG OID	645022399
Product	transcriptional regulator, LacI family
Protein accession	YP_003179837
Protein GI	257784620
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.533751
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.134467
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACTCGCT CGCATAGTTC TAGCTCAAAT AAACGCTCTG TTTCAATGGC TGATGTTGCA 
CAAGTTGCTG GCGTTTCTCA GCAGACCGTC TCTCGTGTTG CTAATGGTGC CCAGAACGTT 
AGCAAAGCAA CGCGTGAAAA AGTTCAAGCC GCAATGGAGT CTATGGGCTT TAGGCCAAGC 
TTTGCTGGTA GGTCATTGAG GTCTGGCTTG TATCAATCAG TGGGACTTTG TCTGTATGAC 
ATTCGCGAGT TTGGTAACTT AGCTACTCTC GACGGCATTG TTTCGGCTGC TCGTGATCAT 
GAATATGCAA TTACGATGAT TGAGAAGGGT TCTGGCGACG GCTTATGCCT TCAGGATATT 
TCTCATCGCA TGTCTAATCT TCCCGTTGAT GGCATGATTA TTAGTATGAG TCTTATGGCG 
TCAGACTTTG AATCTTTTGT ACCACAACCA GGTCTTGGAA CAGTTCTTCT TACCATGCAT 
GAGCATCCTT ACTGTACCAC TGTTGATTCT GATCAGTATG GCTGCTCAAA GCTTGTCATT 
GACCATCTCT TTGAACTTGG GCATCGCAAA ATCCGTTTTG TAGCAGGTCC CTCATACTCT 
ATTGACTCAC AATTTCGCGA GAAGGGCTGG CGAGATGCAA TGTCTGAGTA TGGGTTGGAA 
ATTGTCGAGC CATTTGCTGG TGACTGGACT GCTAATAGTG GCTATGAAAT TGGTAAAAAG 
TTGCGAGAAA ATCGCGATTA TACGGCAGTG TATGTTGCAA ACGATCAGAT GGCACTTGGT 
GTCATTGCGG CATTTGAAGA AGTTGGACTG AGCGTTCCAG ATGATGTCAG CGTTGTTGGT 
GTTGACGACT CTCTTGAAAA TTATTTGCCT AACTTCTCAT TAACCACAGT TCGCTTTAAC 
CTACTAGAGC GCGGACGTGT TGCACTTGAG CATGCAATTC GTGCATCTGA GCCTGGATAT 
AAACCCGAAG CAATCAGAAT TGCTCCAAAG CTCATTGTTC GTACTACCAC AGCAGCACCA 
CAGAAGTAG

Protein sequence

MTRSHSSSSN KRSVSMADVA QVAGVSQQTV SRVANGAQNV SKATREKVQA AMESMGFRPS 
FAGRSLRSGL YQSVGLCLYD IREFGNLATL DGIVSAARDH EYAITMIEKG SGDGLCLQDI 
SHRMSNLPVD GMIISMSLMA SDFESFVPQP GLGTVLLTMH EHPYCTTVDS DQYGCSKLVI 
DHLFELGHRK IRFVAGPSYS IDSQFREKGW RDAMSEYGLE IVEPFAGDWT ANSGYEIGKK 
LRENRDYTAV YVANDQMALG VIAAFEEVGL SVPDDVSVVG VDDSLENYLP NFSLTTVRFN 
LLERGRVALE HAIRASEPGY KPEAIRIAPK LIVRTTTAAP QK