Gene Apar_0653 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0653
Symbol
ID	8413513
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	729560
End bp	730609
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	47%
IMG OID	645022230
Product	tryptophanyl-tRNA synthetase
Protein accession	YP_003179673
Protein GI	257784456
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0180] Tryptophanyl-tRNA synthetase
TIGRFAM ID	[TIGR00233] tryptophanyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00257706
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAAACG AAGGCAGTTA TGAAGCAGCT GTACGCCGTT CTGATGAAAT CCAGGCGGAT 
TTAGCTGAGC ATGCAGGAAA GTACAACATG CTTACTGGTG ACCGTCCTAC TGGAAGACTT 
CACCTTGGCC ATTACTTTGG CACTATTGTT GAGCGCGTAA GACTCCAAAA TCTTGGTGTT 
CATACCAATA TTATTATTGC TGACTATCAG GTTATTACAG ACAGAGACAC TACTGAGCAT 
ATTGCAGACA ATGTCTACAA TATGGTTATT GATTATCTGG CCTGCGGAAT TGATCCAGAA 
AAGACCATGA TTTTCACACA TTCTGCAGTT CCAGCTCTTA ATCAGCTTAT GCTTCCGTTC 
CTCTCGCTTG TTAGTGAGTC TGAACTGCAT AGAAATCCAA CCGTTAAGGC AGAGCAAGAG 
GCATCTGGAC ATGCTCTCAC AGGTCTTCTC CTAACCTATC CTGTTCACCA GGCATGCGAC 
ATTCTCTTCT GTAAAGGAAA TGTTGTTCCT GTTGGTCGCG ATCAGCTGCC TCACATTGAG 
ATTACTTCTA AAATTGCTCG TCGCTTTAAT GAGCGCTACG GAAAGGTATT CCCAGAGGTT 
TCTGGCCTTC TCACCTCCAC CCCACTTATT CCTGGTCTTG ATGGTCGCAA GATGAGCAAG 
TCTTACGGAA ATGCTATCTC GCTTTCTATG ACAGCTGAGG AAACTGCCAA GCTTATCAAG 
AAGTCAAAGA CTGACTCCGA GCGCATGATT ACCTTTGACC CAGAGAACCG TCCTGGCGTC 
TCAGCGCTGC TCACCACTGC TGGCATTTGT ACTGGCCGTG ATCCAAAAGA AATTGCTGAC 
GAGATTGGCA TGGGTGGTGG CGGAGCACTC AAGGCTTACG TCATTGATGC TGTTAACTCC 
TACTTTGAGC CAATTCGTCA GAGGCGCGCA GAGTTTGCAG CTCAGCCAGA TCTTATTCGC 
GATATCCTCC ACGACGGAAA TGCTCGTGCA AACGTTATTG CTAATGCAAC GCTTGACGAG 
GTTCGTGAAG CAATGGGAAT GGTCTACTAA

Protein sequence

MPNEGSYEAA VRRSDEIQAD LAEHAGKYNM LTGDRPTGRL HLGHYFGTIV ERVRLQNLGV 
HTNIIIADYQ VITDRDTTEH IADNVYNMVI DYLACGIDPE KTMIFTHSAV PALNQLMLPF 
LSLVSESELH RNPTVKAEQE ASGHALTGLL LTYPVHQACD ILFCKGNVVP VGRDQLPHIE 
ITSKIARRFN ERYGKVFPEV SGLLTSTPLI PGLDGRKMSK SYGNAISLSM TAEETAKLIK 
KSKTDSERMI TFDPENRPGV SALLTTAGIC TGRDPKEIAD EIGMGGGGAL KAYVIDAVNS 
YFEPIRQRRA EFAAQPDLIR DILHDGNARA NVIANATLDE VREAMGMVY