Gene Franean1_0425 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0425
Symbol
ID	5668848
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	500080
End bp	501174
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	70%
IMG OID	641239357
Product	LacI family transcription regulator
Protein accession	YP_001504796
Protein GI	158312288
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.888688
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCACAACG CCCGCATCGT CAGTACGCTC CGCGACGTGA CAGACCCCGA GGGAACCGAA 
CGCACCACCA TCCAGGACGT CGCCGCCGCC GCCGGCGTCT CAGTCTCGGC GGTCTCGAAG 
GTGCTGCGCG GCGCGTACGG AGTCAGCCCG CAGATGCGCA CCCGGGTAAC CGCCGCGATC 
GACCGGCTCG GCTATCGCCC GCACACCGGC GCACGGGCGA TGCGCGGCCG CACGTACACC 
GTCGGCGTAG TCCTCGTCGA ACTCACCTCG CCGTTCCAGA CCGAGGTGGC CAAGGGCATC 
AGCGACGCGC TCGAGGACAC GTCGTACCAG GACATCCTCG TCACCGCCGG CGCGACCCCC 
GAGCGCCAGA AGAGCCGTAT CGAGGCCCTG CTCGACCGCC ACGTCGACGG GCTGGTGCTG 
ATCGCGCCCT GGATCGAAGT CGCGTGGATC GAAAAGATCG CGCAAGCCCT CCCGGTGGTA 
GCTGTCGCCC TGCACGGCAC TCCCCGCAAC TTCGACACCG TCGTCGACGA CGAACGGCTG 
GGCGCCCAGC TGATGGTCGA TCATCTCGTC GCGGCCGGGC ACCGGCAGAT CGCGCACACC 
AGCGCGCCGC GGGCCGCGTT CGAGGACACG TTCGTGCTGT CGCACACGGC CCGGCGCCAG 
GGGTACGAAC AGGCGATGCG CGGCCACGGC CTGCGACCGG ACGTCATCGA GACCTGGCTG 
TCGGAGGAGG GCGGCCATCA GGCCGCCCAG CAGGCCTTCG ATCGGGCCCG CCCACCGACC 
GCAATCTTCG CCGGGGCCGA CATCGCCGCG TTCGGCGTGC TGCGTGCCGC CGAGGAACGC 
GGGTTGCGGG TGCCGGAGGA CGTGTCGGTA GCCGGCTACG ACAACATCTA CACCTCCACG 
ATCAACCGGG TCTCCCTGAC CACCGTCGAC CAGTCCGGCC ACGGCACGGG CGCGGAAAGC 
ATCCGTCTGC TGCTCGAACG CATTGAAGGC CGCGCCCAGC CCCGGCAATT CGTCGTGTCC 
CCGCACCTGG TGACCCGTCG GACCACCACA GCCCCGTCCG GCACCGGGAT CAGCAACCGT 
GGGCGCACGG TCTGA

Protein sequence

MHNARIVSTL RDVTDPEGTE RTTIQDVAAA AGVSVSAVSK VLRGAYGVSP QMRTRVTAAI 
DRLGYRPHTG ARAMRGRTYT VGVVLVELTS PFQTEVAKGI SDALEDTSYQ DILVTAGATP 
ERQKSRIEAL LDRHVDGLVL IAPWIEVAWI EKIAQALPVV AVALHGTPRN FDTVVDDERL 
GAQLMVDHLV AAGHRQIAHT SAPRAAFEDT FVLSHTARRQ GYEQAMRGHG LRPDVIETWL 
SEEGGHQAAQ QAFDRARPPT AIFAGADIAA FGVLRAAEER GLRVPEDVSV AGYDNIYTST 
INRVSLTTVD QSGHGTGAES IRLLLERIEG RAQPRQFVVS PHLVTRRTTT APSGTGISNR 
GRTV