Gene BURPS1106A_1761 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_1761
Symbol	nusA
ID	4902040
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	1719825
End bp	1721300
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	65%
IMG OID	640134991
Product	transcription elongation factor NusA
Protein accession	YP_001066030
Protein GI	126455004
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA [TIGR01954] transcription termination factor NusA, C-terminal duplication

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCGCG AAGTGTTGAT GTTGGTGGAT GCGCTGGCGC GCGAGAAGAA CGTCGACAAG 
GACGTCGTGC TGGGCGCGCT CGAAGCGGCC CTCGCGTCGG CTTCCAAGAA GCTGTTCGAC 
GAAGGCGCCG AGATCCGCGT ACATATCGAT CGCGAGAGCG GTGAACACGA GACGTTCCGT 
CGCTGGCTCG TCGTGCCCGA CGAGGCGGGC CTCCAAGAGC CGGATCGCGA GATCCTGCTG 
TTCGAGGCGC GCGAGCAGAA GCCCGATGTC GAGGTCGGCG ACTATATCGA AGAATCGGTG 
CCGTCGATCG AGTTCGGCCG GATCGGCGCG CAGGCCGCGA AGCAGGTGAT CCTGCAGAAG 
GTGCGCGACG CGGAGCGCGA GCAGATCCTG AACGATTACC TCGAGCGCGG CGAGAAGATC 
ATGACGGGCA CGGTGAAGCG CCTCGACAAG GGCAACTTCA TCGTCGAATC GGGCCGTGTC 
GAGGCGCTGC TGCGCCGCGA CCAACTGATT CCGAAGGAAA ACCTGCGCGT GGGCGACCGC 
GTGCGCGCGT ACATCGCGAA GGTCGACCGC ACCGCGCGCG GCCCGCAGAT CGAGCTGTCG 
CGCACCGCGC CCGAATTCCT GATGAAGCTC TTCGAGATGG AAGTGCCGGA AATCGAGCAG 
GGGCTTCTCG AGATCAAGGC GGCGGCCCGC GATCCGGGCG TGCGCGCGAA GATCGGCGTC 
GTCGCGTACG ACAAGCGGAT CGATCCGATC GGCACGTGCG TCGGCATTCG CGGCTCGCGC 
GTGCAGGCCG TGCGCAACGA GCTCGGTGGC GAAAACATCG ACATCGTGCT ATGGTCGGAG 
GATCCCGCCC AGTTCGTGAT CGGCGCGCTC GCGCCGGCGG CCGTCCAGTC GATCGTCGTC 
GATGAAGAAA AGCATTCGAT GGACGTCGTC GTCGACGAGA ACGAATTGGC TGTCGCGATC 
GGCCGCAGCG GCCAGAACGT GCGTCTTGCC AGCGAACTGA CCGGCTGGCA GATCAACATC 
ATGACGCCGG ACGAATCCGC CCAGAAGCAG AACGAAGAGC GCGACGCGCT GCGCGGCCTG 
TTCATGGCGC GCCTCGACGT CGACGAGGAA GTCGCGGACA TCCTGATCGA CGAAGGCTTC 
ACGAGCCTCG AAGAGATCGC CTACGTGCCG CTCAACGAGA TGCTCGAGAT CGAGGCGTTC 
GACGAGGACA CCGTGCACGA ACTGCGCAAC CGCTCGCGCG ACGCGCTGCT CACGATGGCG 
ATCGCGAACG AGGAGAAGGT CGAGACGGCC GCCCTCGATC TGAAGAGCCT CGACGGCGTC 
ACGCCCGAAC TGCTCGCGAA GCTGGCCGAG CAGGGCGTGC AGACGCGCGA CGATCTCGCG 
GAGCTTGCCG TGGACGAGCT GGTCGACATG ACCGGCATGG AAGAGGAAGC CGCGAAGGCG 
CTGATCATGA AAGCACGCGA ACACTGGTTC CAGTGA

Protein sequence

MSREVLMLVD ALAREKNVDK DVVLGALEAA LASASKKLFD EGAEIRVHID RESGEHETFR 
RWLVVPDEAG LQEPDREILL FEAREQKPDV EVGDYIEESV PSIEFGRIGA QAAKQVILQK 
VRDAEREQIL NDYLERGEKI MTGTVKRLDK GNFIVESGRV EALLRRDQLI PKENLRVGDR 
VRAYIAKVDR TARGPQIELS RTAPEFLMKL FEMEVPEIEQ GLLEIKAAAR DPGVRAKIGV 
VAYDKRIDPI GTCVGIRGSR VQAVRNELGG ENIDIVLWSE DPAQFVIGAL APAAVQSIVV 
DEEKHSMDVV VDENELAVAI GRSGQNVRLA SELTGWQINI MTPDESAQKQ NEERDALRGL 
FMARLDVDEE VADILIDEGF TSLEEIAYVP LNEMLEIEAF DEDTVHELRN RSRDALLTMA 
IANEEKVETA ALDLKSLDGV TPELLAKLAE QGVQTRDDLA ELAVDELVDM TGMEEEAAKA 
LIMKAREHWF Q