Gene Lferr_0554 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lferr_0554
Symbol
ID	6876516
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidithiobacillus ferrooxidans ATCC 53993
Kingdom	Bacteria
Replicon accession	NC_011206
Strand	+
Start bp	517416
End bp	518897
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	60%
IMG OID	642788437
Product	NusA antitermination factor
Protein accession	YP_002219015
Protein GI	198282694
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA [TIGR01954] transcription termination factor NusA, C-terminal duplication

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.557873
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.218927
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCGTG AACTTCTTTA TCTGGCGGAT GCCGTCGCCC ACGAGAAGGA TGTGGACCGG 
GAAGTCATTT TCCTGGCCCT GGAGGCATCT CTGGTCTCCG CATCCAAAAA GAAGTATGGG 
CAGGACTGGC ATATCGCGGT GGATGTGGAT CGTAAGACCG GAGATTATGT AACCCGTCGG 
CTGTGGGAGG TGGTTGCGGA TGATGTCGCG GATTATGACG TGGATCAGCA GATCCGTCTG 
AGCGATGCCC GGAAAACCCG CCCCGAAGCG GAGCCGGGTG ACTACCTCGA AGAGGTGTTG 
CCACCCGTCG AGTTCGGGCG GATCGCGGCA CAAACGGCCA AACAGGTAAT CGTGCAGAAA 
GTGCGGGATG CCGAGCGCGA CCGGATCGTA TCGGACTTTG CGATACGCAA GGGGGATATC 
GTCAGTGGTC TGGTCAAACG CATGGAAAAA GGCAACGCCA TCGTCGACAT GGGGCGCGCC 
GAGGCCATTC TGCCAAAAGA GGAGATGATG CCGCGCGAGG CCATCCGCCC CGGTGACCGG 
GTGAGAGCAC ATCTCCAGGA TGTACGTCGC GTGCAGCGGG GGCCGCAGCT TTTTCTTTCG 
CGGACCAGTC CTGAGTTGCT GATCAAGCTG TTCGCCCAGG AAGTGCCGGA AATCGGGAAC 
GGGATGATCG AAATCATGGG TGCGGCGCGT GATCCCGGCC TGCGGGCGAA GCTGGCCGTG 
CGTTCCAACG ACCCGCGCGT GGACCCCGTG GGGGCTTGTG TGGGCCTGCG CGGTAACCGG 
GTACAGACGG TTATCAACGA GTTGAAAGGC GAGCGGATTG ACATTGTGAT CTGGGCAGCC 
GATCCGGCCA GCTATGTGAT CAACGCCCTT TCACCCGCGG AAGTGTCCAG CATCGTGGTC 
GACGAGAACA CCCACAGTAT GGATGTGGTG GTCGGACCGG AGCACTTGTC CCAGGCCATC 
GGGCGGGGCG GTCAGAATGT ACGGCTGGCG ACTCAGTTGA CGGGCTGGAC CATCAACATT 
CTGACCGAGG AAGAGGCTCA GGCCAAGCGG GAAGAGGAAG AGTCGACCTT TCTCAACCAC 
TTCATCCAGG ATCTGGGTGT GGATGAGGAT CTGGCCGCCC TGCTGGTCAG CGAGGGTTTT 
ACCTCCATTG AGGAGGTGGC CTATGTTCCG GTTGCCGAAA TGATGGAAAT CGATGGTCTG 
GACGAGAACC TCGTCGGCGA ATTGCGGCGC CGTGCGCGTG ACGTCCTGCT CAACAAGGCC 
ATTGCCCAGG AAGAACAGGT GGCGCTCAGT GAACCCGCGG AAGATTTGTT GTCCCTGAAA 
GGTATGGATA AGGGTTTAGC GCACTTACTG GCCAGTAAAG GTGTTGTCAC TTCCGAGGAC 
CTGGCGGAAC TGGCTGCGAG CGAGCTATGC GAGATGGTCG GTGTGGATGA AGAGCGGGCC 
AAGGCTCTCA TTCTGGAGGC GCGTGCGCCC TGGTTTGCTT GA

Protein sequence

MSRELLYLAD AVAHEKDVDR EVIFLALEAS LVSASKKKYG QDWHIAVDVD RKTGDYVTRR 
LWEVVADDVA DYDVDQQIRL SDARKTRPEA EPGDYLEEVL PPVEFGRIAA QTAKQVIVQK 
VRDAERDRIV SDFAIRKGDI VSGLVKRMEK GNAIVDMGRA EAILPKEEMM PREAIRPGDR 
VRAHLQDVRR VQRGPQLFLS RTSPELLIKL FAQEVPEIGN GMIEIMGAAR DPGLRAKLAV 
RSNDPRVDPV GACVGLRGNR VQTVINELKG ERIDIVIWAA DPASYVINAL SPAEVSSIVV 
DENTHSMDVV VGPEHLSQAI GRGGQNVRLA TQLTGWTINI LTEEEAQAKR EEEESTFLNH 
FIQDLGVDED LAALLVSEGF TSIEEVAYVP VAEMMEIDGL DENLVGELRR RARDVLLNKA 
IAQEEQVALS EPAEDLLSLK GMDKGLAHLL ASKGVVTSED LAELAASELC EMVGVDEERA 
KALILEARAP WFA