Gene Acry_1020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acry_1020
Symbol
ID	5160674
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidiphilium cryptum JF-5
Kingdom	Bacteria
Replicon accession	NC_009484
Strand	+
Start bp	1132168
End bp	1133169
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	69%
IMG OID	640552937
Product	tryptophanyl-tRNA synthetase
Protein accession	YP_001234156
Protein GI	148260029
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0180] Tryptophanyl-tRNA synthetase
TIGRFAM ID	[TIGR00233] tryptophanyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCACGCA TATTTTCGGG CATCCAGCCC ACCGGAATCG CGCATCTCGG CAATTATCTC 
GGCGCGATCC AGAACTGGGT CGCGCTGCAG GAGGGCAACG AGGGCATCTA CTGCCTGGTC 
GACCTGCACG CGCTCACCGT CTGGGTCGAG CCCGAGGCGC TGCGCCAGCA GACGCGGGTG 
AACGCCGCCC TGCTCGTCGC CTGCGGCATC GACCCCGCCC GCAGCATCCT GTTCCACCAG 
TCGGCGGTGC ACGCCCATGC GCGCCTCGCC TGGATCTTCA ACTGCGTCGC CCGCTTCGGC 
TGGCTGAACC GCATGACCCA GTTCAAGGAC AAGGCCGGCA AGGACCGCGA GGCCGTCTCC 
ACCGGCCTGT TCGTCTATCC CAACCTGATG GCCGCCGACA TCCTCGCCTA TCACGCGACC 
GAGGTGCCCG TCGGCGAGGA CCAGAGCCAG CATCTCGAAC TCGCCAACGA CATCGCGCAG 
AAATTCAACC ACGATTACGG GGTGGAATTC TTCCCCGCCA TCACGCCGCG CATCATCGGC 
GGCAGCGCGC GCATCATGAG CCTGCGCGAC GGCACCAGGA AAATGTCGAA ATCCGACACC 
TCGGACCAGA GCCGCATCAA CCTCACCGAC GATGCCGACG CCATCGCCCA GAAGATCCGC 
CGCGCGAGGA CCGACCCGGA ACCGCTGCCC GAGCGCCCGG CGCAGCTCGA TTCCCGCCCC 
GAGGCCCGCA ACCTCGTCGG CATCTACGCC GCCCTCGCCG GCATCACCGC CGAGGAGGTG 
CTGCGCCAGC ACGCCGGCAG CGGATTCGGC CCGTTCAAGG AACGGCTGAC CGAGCTCGCG 
GTGCAGAAAC TCACCCCGAT CGGCGCCGAG ACCAAACGCC TCGCCGCCGA TCCCGCCGAG 
ATCGACCGCA TGCTCCAGGC CGGCGCCGCC CGTGCGGCGG CCATCGCCGA GCCGATCGTC 
GCCGAAGCCG AGCGCCTCGT CGGCCTGCTG CCCGCGCGCT GA

Protein sequence

MARIFSGIQP TGIAHLGNYL GAIQNWVALQ EGNEGIYCLV DLHALTVWVE PEALRQQTRV 
NAALLVACGI DPARSILFHQ SAVHAHARLA WIFNCVARFG WLNRMTQFKD KAGKDREAVS 
TGLFVYPNLM AADILAYHAT EVPVGEDQSQ HLELANDIAQ KFNHDYGVEF FPAITPRIIG 
GSARIMSLRD GTRKMSKSDT SDQSRINLTD DADAIAQKIR RARTDPEPLP ERPAQLDSRP 
EARNLVGIYA ALAGITAEEV LRQHAGSGFG PFKERLTELA VQKLTPIGAE TKRLAADPAE 
IDRMLQAGAA RAAAIAEPIV AEAERLVGLL PAR