Gene Franean1_4931 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4931
Symbol
ID	5675745
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	5920068
End bp	5921561
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	71%
IMG OID	641243785
Product	TetR family transcriptional regulator
Protein accession	YP_001509201
Protein GI	158316693
COG category	[K] Transcription
COG ID	[COG1309] Transcriptional regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.475051
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.080695
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGAGA ACGAGATCCT GCGACGGGCG AGCTACGGCC CCACCAGTCC GGTGGTGGGG 
GCACGCGGTT CACGCACCCG CACGCGCATC GTCGACACGG CGCTGGCGCT ATTCGAATCC 
CAGGGCTTCC ACGGCACGTC GGTGGACGAC ATCGCGAAGG CCGCCGAGGT GTCCCGGGCC 
ACGTTGTACC AGTATTTCGA GAGCAAGGAA CAGATCTTCG TCGAGCTGCT CGAGGAATGC 
GGCGGCGCGC TCATGCGGGT GGTTCGCCGC ATCGGCCCGC TGGAACCCAG CGAGCTCGGC 
TTCGACAATC TGCACTGGTG GCTCGGCGAG TGGGCCTGGG TGTACGACAG GTACGCGACG 
ATGTTCGTGC AGTGGGCGAA CATCAGTTCG CCCGGCACCG CGATACCGCC GCTGGTCAGC 
CGCTTCTCGG CCGCCTACCG GGAGCGGATC GCGCAGCGGC TGACCTCGTC GGGGGTGACC 
GGCCTCGCCG CCGCCGACGC GGCGCTGACA CTGACCGCGC TGGTGAGCAG CTGTAACTAC 
ACGCGCCATG CCGATGCGCC GCTCGGCCGT GAACACCCCG GCACCGGGCC GGCCGCCCGC 
GGCACGGTGA TGGGCACCGA CTACCTGACC GACAACCTCG CCGTGCTGGT CCAGCTCATC 
CTTTTCCCGC ACACCCCCGT GAGTGTTTTC GCCCAGCTGG GCCGGGAGAT CCCCACCCCG 
CGCCCGCCGA GCACCGGAGA ACGCCTCTGG TCCGTACCGG CACCGGCGGC CGGGCCGCCG 
CCGGCTTTGC CGCCGGATGG CCGTCTGCGG CAACTCAGCA GCCGCGCCAC GGTGACCGTT 
CGGCGACTTC TCGACGCCGG GATCAGATGT TTCACCGAAA AGGGCTACCA CCAATGCTCG 
GTCGACGACA TCGTCACCGA GGCGGGTTAC GCGCGCGGCA CGTTCTACAA GTATTTCGAC 
GAGAAACTCG ACCTGCTGGT GGCGCTGAGC GACGAGGCGA TCGAGACGAT CACCGAGCTC 
GACGGCCGGC TGCGGCGGAT CGGCCCGACT CTCGGGAGCG ACCCCGCCCA GCTACGGAGC 
TGGCTCGGTG ACGCCGTCGC GTTCCACCTG CGGTACCTGG GCGTCACACG GGCCTGGCTC 
GACCGGCGGC CGTGCCACCC ACGCCTCGAC GCGGCCCGCC GGCTCGTCGG CGAACGGCTG 
CACACCGGCT ACACCGCCCT GCTGGGCCCG GCGCGCTGGT CGCATCCGCT TGATCCGCGG 
GTCGCCAGCA TCGCGTTCTT CACCCTGCTG GAGCGACTGC CCGAGGCGAT GGTGGCGGCC 
GAGCCGGACC GCCCGCTCAC GGAGATCGTC GACCTCGTCG CCACGGTGCT CGAACGCGCG 
CACCTGTGCC CCCAGAGCGG CCCCCACGAC TCCCAGCCCG CCGGCGCCGA CCAAGACAGC 
GCCCGGGCCG CCGCCGCGTC CGTCCCCTCG GGACGCCACC TCCCCCGGCC CTGA

Protein sequence

MSENEILRRA SYGPTSPVVG ARGSRTRTRI VDTALALFES QGFHGTSVDD IAKAAEVSRA 
TLYQYFESKE QIFVELLEEC GGALMRVVRR IGPLEPSELG FDNLHWWLGE WAWVYDRYAT 
MFVQWANISS PGTAIPPLVS RFSAAYRERI AQRLTSSGVT GLAAADAALT LTALVSSCNY 
TRHADAPLGR EHPGTGPAAR GTVMGTDYLT DNLAVLVQLI LFPHTPVSVF AQLGREIPTP 
RPPSTGERLW SVPAPAAGPP PALPPDGRLR QLSSRATVTV RRLLDAGIRC FTEKGYHQCS 
VDDIVTEAGY ARGTFYKYFD EKLDLLVALS DEAIETITEL DGRLRRIGPT LGSDPAQLRS 
WLGDAVAFHL RYLGVTRAWL DRRPCHPRLD AARRLVGERL HTGYTALLGP ARWSHPLDPR 
VASIAFFTLL ERLPEAMVAA EPDRPLTEIV DLVATVLERA HLCPQSGPHD SQPAGADQDS 
ARAAAASVPS GRHLPRP