Gene Bind_1049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_1049
Symbol
ID	6198846
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	-
Start bp	1204755
End bp	1206371
Gene Length	1617 bp
Protein Length	538 aa
Translation table	11
GC content	60%
IMG OID	641705042
Product	NusA antitermination factor
Protein accession	YP_001832181
Protein GI	182678035
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA [TIGR01954] transcription termination factor NusA, C-terminal duplication

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGTGA GCGCCAATAG GCTCGAGCTT CTGCAAATCG CCGATGCCGT CGCGCGAGAG 
AAATCGATCG ACCGGCAGAT CGTCCTGGCC TCCATGGAGG ACGCGATCCA GAAAGCTGCG 
CGCTCGCGCT ACGGTCAGGA GACCGAAGTG CGCGCTGAGA TCAATCCGAA GACCGGAGAA 
ATCCGCTTCT CGCGATTGCT GCATGTCGTC GATGAGATCG ATAATGACGC GGTGCAGATC 
ACCCTCGCGG AGGCCCGCAA GAAGAATCCC GCCGCCGAAC TTGGCGACTG GATCGCCGAA 
ACCCTGCCGC CCTTCGACTT CGGCCGCATC GCCGCCCAAT CGGCGAAGCA GGTGATCGTT 
CAGAAGGTGC GCGAGGCCGA GCGCGATCGG CAATATCAGG AATATAAGGA CCGCATTGGC 
GATATCGTCA ACGGCGTCGT CAAGCGCGTC GAATATGGCA ATGTCATCAT TGATCTCGGG 
CGTGGCGAGG CGACCATCCG GCGCGACGAG ATGATCCCGC GCGAAGTGTT CCGCCCCGGC 
GATCGCGTGC GTGCCTATGT CTATGACGTG CGGCGCGAGC AGCGCGGACC CCAGATTTTC 
CTCTCCCGCA CGCATCCCCA ATTCATGGCC AAGCTGTTCC GTCAGGAAGT GCCTGAAATC 
TACGACGGCG TGATCGAGGT GAAGGCCGTG GCGCGCGATC CAGGCTCGCG CGCCAAGATC 
GCCGTCATCT CGCGCGATAC GTCGATCGAT CCGGTCGGTG CCTGCGTCGG CATGCGCGGC 
TCGCGCGTTC AGGCGGTCGT CAATGAATTG CAGGGCGAGA AGATCGACAT CATTCCCTGG 
TCGCCCGATG CCGCCACCTT CATCGTCAAT GCCTTGCAGC CGGCGGAAGT CGTCAAGGTC 
GTGCTCGACG AGGATTCAGC GCGTATTGAA GTCGTGGTTC CGGATGACCA ATTATCCTTA 
GCAATCGGCC GTCGTGGCCA GAATGTCCGC CTTGCCTCGC AATTGACCGG CTGGGATATC 
GACATTTTGA CCGAGGCTGA GGAATCGGCC CGCCGCCAGA AGGAATTCAC CGAGCGTACC 
GCCATGTTCA TGGGTGCGCT CGACGTTGAT GAAGTGGTCG GCCAATTGCT TGCCTCGGAA 
GGCTTCCGTT CGGTCGAGGA ACTTGCTTTC GTCGAACCTT CCGAACTTGC GGTGATCGAA 
GGTTTCGACG AGGAAACGGC GGCTGAGATT CAGGCCCGCG CCAATGCCTA CCTCGCCCGC 
ATCGAGGCTG AACATGAAAC GCGCCGGCGC GAGCTCGGTG TTTCCGACGA TCTGCTCGAG 
ATCGACGGTT TGACCAATGC CATGCTCGTG AAATTTGGTG AAAACGATAT CAAGACCGTC 
GAGGATCTCG CCGGCTGCGC CACCGACGAT CTCGTCGGCT GGAGCGAGCG CAAGGATGGC 
GAAACCACAC GCCATCCAGG CATTCTTGAC GGATTTGAAG TGTCGCGCGA GGAAGCCGAG 
GGTCTTATTA TGAAGGCGCG GGTGAAAGCC GGCTGGATCG ATGCCCTGCC CGAAGCCTCC 
GAACCCGAAC AAGAGACTTT CGCCGAAGCC GAGACGCAAA GCGAAAGCGC TGACTGA

Protein sequence

MAVSANRLEL LQIADAVARE KSIDRQIVLA SMEDAIQKAA RSRYGQETEV RAEINPKTGE 
IRFSRLLHVV DEIDNDAVQI TLAEARKKNP AAELGDWIAE TLPPFDFGRI AAQSAKQVIV 
QKVREAERDR QYQEYKDRIG DIVNGVVKRV EYGNVIIDLG RGEATIRRDE MIPREVFRPG 
DRVRAYVYDV RREQRGPQIF LSRTHPQFMA KLFRQEVPEI YDGVIEVKAV ARDPGSRAKI 
AVISRDTSID PVGACVGMRG SRVQAVVNEL QGEKIDIIPW SPDAATFIVN ALQPAEVVKV 
VLDEDSARIE VVVPDDQLSL AIGRRGQNVR LASQLTGWDI DILTEAEESA RRQKEFTERT 
AMFMGALDVD EVVGQLLASE GFRSVEELAF VEPSELAVIE GFDEETAAEI QARANAYLAR 
IEAEHETRRR ELGVSDDLLE IDGLTNAMLV KFGENDIKTV EDLAGCATDD LVGWSERKDG 
ETTRHPGILD GFEVSREEAE GLIMKARVKA GWIDALPEAS EPEQETFAEA ETQSESAD