Gene Franean1_4355 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4355
Symbol
ID	5672710
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	5199243
End bp	5200313
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	71%
IMG OID	641243228
Product	AraC family transcriptional regulator
Protein accession	YP_001508645
Protein GI	158316137
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTCGTCT TCCGCTCGGC GGGCCCGCGC GGTTCGCGGG TACCTGTCTC ACCCTGCCGC 
CCGCCGGAAA CATACGGTAG TGGCCTGAAT GCCACATATC CCAAGGATCA GGCCATGCAT 
CGGATCGTCG TCGTCGCCGT CCCGCCGGTC ACCACCCTTG ATCTGTCCAT CCCGGCGGCA 
GTGTTCCCGG CCGCGGTGGT CCACAGCCAG CCGGCCTACG AGGTCGTGAT CTGCACGGCC 
GAGCCCGGGA TCGTACCTGG GTACACCGGG CCCAGCGTTG TGGTGGACCG GGGCCTCGAC 
GTGATCGACA GCGCCGACAC CGTGATCGTC ACGGGAACCG GAGCTCGCGC CCACGCCGAC 
CAACGGGTCC TGGACGCGCT ACAGCGGGCC GCTGACGACG GCCGGCGCAT CGCCTCGATC 
TGCACGGGCG CCTTCGTGCT GGCCCAGGCC GGGCTGCTCA ACGGTCGCCC GGCCACCACG 
TACTGGCAGT ACTCCCAGGA GATGCGCCGC CGCTTCCCAG CCGTCGACCT GCGGCCCGAC 
GTCCTGTACG TCGACGACGG GACCGTGCTG ACCTCCGCCG GCCTGGCCGC CGGTCTCGAC 
CTGTGCATCC ACATGATCCG GCGCGACCAC GGGGCGGTGG TCGCCAACGC CGTCGCCCGA 
GCCGCGGTCA TCGCGCCGAT CCGTCCCGGC GGCCAGGCCC AGTTCATCGA GACACCGCTG 
CCACCGGAGA ACGGGACCTC GCTGGCCCAG ACCCGCGCCT GGGCGGCGGA GCACCTCGCC 
GAACCGCTGA CACTCGCCCG CCTCGCCGCC CACGCCCACA CCAGTACCCG CACGCTCACC 
CGCCGCTTCC GGGAGGAGAC CGGTCTCAGC CCACTGCAAT GGTTGCTGCA CCAGCGAATC 
GACCGGGCTC GGGAACTCCT CGAGGCGACG GATCTGCCGA TCACCGCCGT CGCCCGGCAA 
AGCGGCCTGG GAACCCCCGA GTCGCTGCGC CTCCACCTCC TGCGCCGCAA CGGGCTCACC 
CCCAGCGCCT ACCGCGACAC ATTCACCCGC GTCGGACCAA CCCCGACCTG A

Protein sequence

MFVFRSAGPR GSRVPVSPCR PPETYGSGLN ATYPKDQAMH RIVVVAVPPV TTLDLSIPAA 
VFPAAVVHSQ PAYEVVICTA EPGIVPGYTG PSVVVDRGLD VIDSADTVIV TGTGARAHAD 
QRVLDALQRA ADDGRRIASI CTGAFVLAQA GLLNGRPATT YWQYSQEMRR RFPAVDLRPD 
VLYVDDGTVL TSAGLAAGLD LCIHMIRRDH GAVVANAVAR AAVIAPIRPG GQAQFIETPL 
PPENGTSLAQ TRAWAAEHLA EPLTLARLAA HAHTSTRTLT RRFREETGLS PLQWLLHQRI 
DRARELLEAT DLPITAVARQ SGLGTPESLR LHLLRRNGLT PSAYRDTFTR VGPTPT