Gene Tcr_1122 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tcr_1122
Symbol
ID	3762063
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thiomicrospira crunogena XCL-2
Kingdom	Bacteria
Replicon accession	NC_007520
Strand	+
Start bp	1210101
End bp	1211588
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	44%
IMG OID	637785843
Product	NusA antitermination factor
Protein accession	YP_391391
Protein GI	78485466
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA [TIGR01954] transcription termination factor NusA, C-terminal duplication

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAGG AAGTTTTAGC AGTTGTTGAA ATCATGTCTA ACGAAAAAGG CGTGGAAAAA 
GAAATTATCT TTGAAGCCAT TGAAGCGGCT CTAGCGACAG CAACTAGAAA AAGTCATAAT 
GATGAAATTG ACGCCCGTGT TTCTATTGAT CGACATACGG GTGATTACGA AACTTTCCGT 
CGCTGGGAAG TGATTGAAGA CGATGTCGAG ATTGAAGACC ACGTTGGTTG GTATATTCGC 
CATATGGATG CGGTTGACAT TGAACCGCAT ATTGAGCCAG GTGAATTTAT TGAAGAACCA 
ATGGAGTCGA TCGAATTTGG CCGTATTGGT GCGCAAACAG CGAAGCAAGT GATTATTCAA 
AAAGTCCGTG AAGCTGAGCG TAAAAAAGTG GTCGAAGAAT ATTCGAAACG CATCGGAGAA 
ATTTTAACTG GTCAGGTTAA GCGTATTGAT CGCGGTGATG TCATTCTGGA TTTAGGGGAT 
AACGTGGATG CGGTCATTCC TCGTTCAGAA TTGATTAACC GCGAAAACTT TAAAATGGGC 
GATCGTGTCC GTGCTTATGT TCAAGATGTT TCTTTCCGTC CTCGCGGCCC ACAGATTTTC 
ATGTCTCGTG CGTGTAAAGA AATGTTGATG GAACTGTTTA AAATCGAAGT GCCTGAAATT 
GGTGACGACT TAATCGACAT TATGAGTGCG GCTCGTGATG TTGGTTTAAG AGCCAAGGTG 
GCCGTTCGTG CTAACGACCC ACGCTTAGAT CCTATCGGAG CTTGTGTCGG GATGCGTGGT 
GGACGTGTTC AAGCGGTGAC AAATGAATTA AATGGAGAAC GTATCGACAT TATCCTTTGG 
GATTCAAACG ATGCGCAGTT TGTTATTAAT GCGATGGCCC CAGCAGAAGT CACGTCCATT 
ATGGTGGATG AAGACAAGCA TACAATGGAC TTGGCGGTTG ATGATGAGCA GTTGTCTCAG 
GCCATTGGTA AAAACGGTCA AAACATCCGC TTGGCAACCG AACTAACAGG TTGGGAGCTG 
AATGTCATGT CTGAAACGGA CATGGCTGCG AAGCATGAAA CAGAATCGAA AGGTCAGATG 
GATTTATTCG TCAACGGCTT GGAAGTCGAT GAAGAACTTG CAGAAGTTCT AGTCGCAGAA 
GGTTTTACAA CACTTGAAGA AGTGGCGTAT GTTCCGGCTG CGGAAATGTT AGAGATTGAA 
GGCTTTGATG AAGAAATTGT TGCAGCTTTA AAAGAAAGAG CTAAAGACGC ACTGTTGACT 
CAAGCAATTG CAAACGAAGA AAAGACAGCC ATGGCTGAAC CAGCGCAAGA TTTATTGGAC 
TTAGAAGGCA TGACTGAAGA AATGGCAAAA ACGCTCGCTT CTAAAGGAAT CATCACTCAG 
GAAGATTTAG CTGAATTAGG CACGGATGAA TTATTAGAAA TAGTAGAGAT GGATGCGGAC 
GCAGCTAGCG AATTGATTTT GAAAGCACGC GCACCATGGT TTGAATAA

Protein sequence

MSKEVLAVVE IMSNEKGVEK EIIFEAIEAA LATATRKSHN DEIDARVSID RHTGDYETFR 
RWEVIEDDVE IEDHVGWYIR HMDAVDIEPH IEPGEFIEEP MESIEFGRIG AQTAKQVIIQ 
KVREAERKKV VEEYSKRIGE ILTGQVKRID RGDVILDLGD NVDAVIPRSE LINRENFKMG 
DRVRAYVQDV SFRPRGPQIF MSRACKEMLM ELFKIEVPEI GDDLIDIMSA ARDVGLRAKV 
AVRANDPRLD PIGACVGMRG GRVQAVTNEL NGERIDIILW DSNDAQFVIN AMAPAEVTSI 
MVDEDKHTMD LAVDDEQLSQ AIGKNGQNIR LATELTGWEL NVMSETDMAA KHETESKGQM 
DLFVNGLEVD EELAEVLVAE GFTTLEEVAY VPAAEMLEIE GFDEEIVAAL KERAKDALLT 
QAIANEEKTA MAEPAQDLLD LEGMTEEMAK TLASKGIITQ EDLAELGTDE LLEIVEMDAD 
AASELILKAR APWFE