Gene Apar_0539 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0539
Symbol
ID	8413393
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	624637
End bp	626145
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	46%
IMG OID	645022112
Product	threonine synthase
Protein accession	YP_003179561
Protein GI	257784344
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0259397
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000000259641
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGGCCGTCG CATATCACAG CACAAGAAGC TTTGATCATA CCGTCTCGGC TAAACAGGCC 
ATTTTGCAGG GAATTGCTCC CGATAGCGGC CTCTACATCC AAGATTCTAT TGGCGAGAAA 
CCCCTTGATC TTGTAAAGGT TTGCTCCCAG GACTTTAAGT CTACAGCTTA TGACGTACTT 
TCTACTCTGC TTGATGACTA CTTGCCTGAG GAGTTGAATC GCTGTATTGA AGGTGCATAT 
GGCACTCAGT GGGACACCAA GACCATTACT CCTGTTTCTG CTATCGGAGA TGATTGGCTG 
CTTGAGCTCT TCCATGGTCC GACATCTGCC TTCAAAGACG TTGCACTTCA GATGCTCCCT 
CGCTTGATGA GCGTTGCTCG CGAAGACACA AATGCAGCTA GTACTAGCGG TCAGAATATT 
ATGATTGTCA CCGCTACTTC TGGAGACACT GGTAAAGCTG CACTTGAAGG CTTCAAAGAT 
GTACCAGGTA TGGGTATTAC CGTTTTTTAT CCAGAGGGTA AAGTCTCGGA TATTCAACGC 
CTACAGATGG TGACCCAAAA AGGCTCAAAC ATTGCTGTTT GTGCTGTTAA TGGCAACTTT 
GATGATGCAC AAAATGCCGC TAAAGCAATC TTTGCTAACA AAAAATTAGC TCAGGAATTA 
GCCGGCAAAA ATACTGTACT TTCCAGCGCA AACTCAATTA ATATTGGTCG TTTAGCTCCA 
CAGGTAACCT ACTACTTTGA CGCATATGCT CAACTAGTTG CCAAGGGCAC TATTACGCTG 
GGTCAAAAGA TTACCTTCTG CGTTCCAACT GGCAACTTTG GCGATGTCCT TGCTGGATAC 
TTTGCAAAAG AGATGGGATT ACCTGTTGAT CGCCTTATCG TGGCTTCTAA CAGCAATAAA 
GTGCTAACTG ATTTCTTAAC AACAGGCACC TATGACCGTA GACGTGCATT TGAAAAAACC 
ATCTCTCCAT CAATGGATAT TCTAGTTTCA TCAAATCTTG AACGACTTCT CTATCTTGCA 
TCCGGCAAAG ACACCGAGCT TGTCAGCTAT CTGATGAACC AGCTGGTAAC TAAGGGTATC 
TACACAGTGC CTGCTCAGGT GATGGACACC ATCCGTGAAA CCTTTGACGC TGGCTTTGCC 
ACCGACGACC AGACGCGAGA AACCATTCGT TCTACCTGGG AGAATTGTCG TATGCTGATT 
GATCCTCACA CAGCTGTTGC AAAACACGTA CTTGACAGGG TTTCTCGCCA AACAAACGAC 
GTGCGCATAT GTCTGTCCAC TGCAAGTCCA TACAAGTTTT CGTCCGACGT GCTTGCCGCG 
CTGGGTCACT CGACCGCTGA CCTGAATGAC TTTGCGTGCA TGCATACGCT CGCCGAAATC 
ACAGGCACTA ATCCGCCAAT CCAGCTTTCA TCGCTGAATG ATAACGTTAT CATTCATACT 
GACGTTCGCG AGAAGGAAGA ACTTGCTTCG TACGTTTTTG AGGCATGCGA ACGTATTTTT 
GCTTGTTAG

Protein sequence

MAVAYHSTRS FDHTVSAKQA ILQGIAPDSG LYIQDSIGEK PLDLVKVCSQ DFKSTAYDVL 
STLLDDYLPE ELNRCIEGAY GTQWDTKTIT PVSAIGDDWL LELFHGPTSA FKDVALQMLP 
RLMSVAREDT NAASTSGQNI MIVTATSGDT GKAALEGFKD VPGMGITVFY PEGKVSDIQR 
LQMVTQKGSN IAVCAVNGNF DDAQNAAKAI FANKKLAQEL AGKNTVLSSA NSINIGRLAP 
QVTYYFDAYA QLVAKGTITL GQKITFCVPT GNFGDVLAGY FAKEMGLPVD RLIVASNSNK 
VLTDFLTTGT YDRRRAFEKT ISPSMDILVS SNLERLLYLA SGKDTELVSY LMNQLVTKGI 
YTVPAQVMDT IRETFDAGFA TDDQTRETIR STWENCRMLI DPHTAVAKHV LDRVSRQTND 
VRICLSTASP YKFSSDVLAA LGHSTADLND FACMHTLAEI TGTNPPIQLS SLNDNVIIHT 
DVREKEELAS YVFEACERIF AC