Gene Acry_0223 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acry_0223
Symbol	nusA
ID	5161504
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidiphilium cryptum JF-5
Kingdom	Bacteria
Replicon accession	NC_009484
Strand	+
Start bp	257162
End bp	258682
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	66%
IMG OID	640552139
Product	transcription elongation factor NusA
Protein accession	YP_001233370
Protein GI	148259243
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA [TIGR01954] transcription termination factor NusA, C-terminal duplication

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCATGG ACACCGCCAT AGCCCGCCCC GAACTCCTTC TTGTCGCCGA TGCGGTGGCC 
CGCGAAAAGC AGATCGATCG CGAGGAAGTG CTCGAGGCGA TGGAGCAGGC CATCCAGAAG 
GCCGGTCGCG CCAAATATGG CCACGAGAAG GACATTCGGG CGACGATCGA TCGCAAGACC 
GGCGATGTCC GCCTTTCGCG CTGGACCGAG GCGGTCGAGA CTGTGGAGAA CGAGGAAACC 
CAGATCCCGA TCCATATCGC CCGCAAGTTC AAGCCCGATA TCGAAGTCGG CGGGCATCTG 
GTCGATCCTT TGCCGCCGAT CGATTTCGGC CGCATCGCGG CGCAGACGGC GAAGCAGGTG 
ATCGTCCAGC GCGTCCGCGA ATACGAGCGC AAGCGCCAGT ACGACGAATA CAAGGACCGT 
GTCGGCGAGA TCATCACCGG CGTGGTCAAG CGCACCGAAT ACGGCAACCT CATGGTCGAT 
CTCGGCCGCT CGGAAGCCCT GCTCCGGCGC GACGAGACGA TTCCCCGCGA GAACCTGCAC 
AATGGCGACC GGGTGCGTGC CTTCATCTAC GACGTGCGCG AGGAACCGCG CGGCCCGCAG 
ATCTTTCTCT CACGCACCCA TCCGGGCTTC CTCGCCAAGC TCTTCGCCCA GGAAGTGCCG 
GAAATCTACG AGGGGATCAT CGAGATCAAG GCGGTGGCCC GCGATCCTGG CTCGCGCGCC 
AAGATGGCGG TGATCAGCCG CGATTCCTCC ATCGACCCGG TCGGGGCCTG CGTCGGCATG 
CGCGGCTCGC GCGTGCAGGC GGTGGTGGCC GAACTGCAGG GCGAAAAGAT CGACATCATT 
CCGTGGAGCC CGAATCCGGC GACCTTCGTG GTCAACGCGC TCGCCCCGGC CGAGGTCTCG 
AAGGTCGTGC TCGACGAGGA GGCCGGCAAG GTCGAGGTCG TCGTGCCCGA CACCCAGCTC 
TCGCTCGCGA TCGGCCGGCG CGGCCAGAAT GTCCGCCTTG CCAGCCAGCT TACCCGCTGG 
GATATCGACA TCTTGACCGA GGCCGAGGAA AGCGAACGGC GCCAGGAAGA GTTCCGCCGC 
CGCTCCGGCC TGTTCGTCGA GGCGCTCGAT GTCGATGACG TGATCGCCGG CCTGCTGGTC 
ACCGAAGGGT TCGAGGGCGT CGAGGATCTC GCCGCGACGC CGGTCGAGGA ACTTGCGGCG 
ATCGAGGGAT TCGATGAGGG GATCGCCGCC GAACTGCAGC GCCGCGCCGA GGTGGCGCTC 
GAGCGCAAGG CCACCGAACT TGAGGACAAG CGGCGCGCGC TGGGTGTCGC CGATGATCTT 
GCCGGGCTGG AGGGGCTATC GCCTGCCATG CTGGTGGCGC TCGGCGAGAA GGGTGTGAAG 
ACGCTGGACG ATCTTGCCGA TCTTGCCTCT GACGAACTGA TCGAGATCGT CGGCGCCGAT 
GCGATGGACG AGGACGCGGC GAATGCCATC ATCATGGCGG CGCGCGCTCA CTGGTTCGAG 
GGAGAGGAAG ACGCTGGCTG A

Protein sequence

MTMDTAIARP ELLLVADAVA REKQIDREEV LEAMEQAIQK AGRAKYGHEK DIRATIDRKT 
GDVRLSRWTE AVETVENEET QIPIHIARKF KPDIEVGGHL VDPLPPIDFG RIAAQTAKQV 
IVQRVREYER KRQYDEYKDR VGEIITGVVK RTEYGNLMVD LGRSEALLRR DETIPRENLH 
NGDRVRAFIY DVREEPRGPQ IFLSRTHPGF LAKLFAQEVP EIYEGIIEIK AVARDPGSRA 
KMAVISRDSS IDPVGACVGM RGSRVQAVVA ELQGEKIDII PWSPNPATFV VNALAPAEVS 
KVVLDEEAGK VEVVVPDTQL SLAIGRRGQN VRLASQLTRW DIDILTEAEE SERRQEEFRR 
RSGLFVEALD VDDVIAGLLV TEGFEGVEDL AATPVEELAA IEGFDEGIAA ELQRRAEVAL 
ERKATELEDK RRALGVADDL AGLEGLSPAM LVALGEKGVK TLDDLADLAS DELIEIVGAD 
AMDEDAANAI IMAARAHWFE GEEDAG