Gene Rleg2_3031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_3031
Symbol	ftrA
ID	6981776
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	3090066
End bp	3091067
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	65%
IMG OID	643397741
Product	transcriptional activator FtrA
Protein accession	YP_002282524
Protein GI	209550607
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.00937108
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACA GCGTAAAGAT CATGCCAAAC TTATCACCAC AGCAGACGAC AGGACCGTTG 
GTCACAGCCC TTGCCTATGA CGGGCTCTGC ACCTTCGAAT TCGGCATCGC CTACGAGGTC 
TTCGGCCTGC CGCGCCCGGA GATGGGCGAA GGCTGGTATC GCTTCTCGGT CTGCGGCATC 
GAGCCGGGAC CGCTTCACGC CGCCGGCGGG TTGACGGTCG CGGTCGACAA GGGACTGGAG 
ATCCTTGATG AGGCGGATCT GATCGTCGTG CCCGGCTGGC GGGCGATCGA CGCACCGGTG 
CCCGAGCCGC TCGCCGAGGC GCTCCGGGCA GCGCATCAGC GCGGCGCGCG CATCATGTCG 
CTCTGCTCCG GCGTTGCGGT TCTGGCCGGA TCCGGATTGC TTGCCAACCG CAAGGCGACG 
ACGCATTGGC GTTATGTCGC CTCGATCGCC GCTCGTTATC CCGATATCGC GCTCGATGCC 
GGCGTTCTCT ACATCGATGA GGGCAGCCTG TTGACGGCGG CGGGCAGTGC CGCCGGCATC 
GATCTCTGCC TGCATGTGGT GCGCGGCGAT TTCGGCTCGG AGGCCGCAAA CAGCGTCGCC 
CGCCGCCTCG TCGTGCCGCC GCACCGCGAA GGAGGGCAGG CGCAGTTCAT CAGCGCCCCG 
GTTCCGGAAG AGCGTGAGGG CATCCGTCTC GGCCCATTGA TCGAATGGAT GCGCGAAAGC 
CTTTCGCAGG AGCAGCCGAT CAGGCTGCTT GCGAAAAGAG CTGGCATGAG CATGCGCACT 
TTCCAGCGCC GCTTCGAAGC GACGACGGGT CTCAGCGTCG GCGAATGGCT GCTGAAGGAG 
CGGCTGCGCC ATGCCCGTGA CCTTCTCGAG AAAGAGCTTG CGGTCTCGCT CGACGACATC 
GCGGTATCAA GCGGCTTCGG CACGCTGGCG ACGATGCGGC ATCATTTTCG CAGGCGGCTC 
GGGACGAGCC CGAGCGCTTA CAGGCGGTCG TTCGGTCTTT GA

Protein sequence

MTDSVKIMPN LSPQQTTGPL VTALAYDGLC TFEFGIAYEV FGLPRPEMGE GWYRFSVCGI 
EPGPLHAAGG LTVAVDKGLE ILDEADLIVV PGWRAIDAPV PEPLAEALRA AHQRGARIMS 
LCSGVAVLAG SGLLANRKAT THWRYVASIA ARYPDIALDA GVLYIDEGSL LTAAGSAAGI 
DLCLHVVRGD FGSEAANSVA RRLVVPPHRE GGQAQFISAP VPEEREGIRL GPLIEWMRES 
LSQEQPIRLL AKRAGMSMRT FQRRFEATTG LSVGEWLLKE RLRHARDLLE KELAVSLDDI 
AVSSGFGTLA TMRHHFRRRL GTSPSAYRRS FGL