Gene Franean1_1330 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1330
Symbol
ID	5669741
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	1598991
End bp	1600205
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	67%
IMG OID	641240261
Product	XRE family transcriptional regulator
Protein accession	YP_001505688
Protein GI	158313180
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGACG ACCAGATCCG CGGTGTGGGC GAGCGCATCG CCGATGCACG CAAGGCCCGC 
AGCTTCAGTC AACGCCAGCT GGCCGAACAC GCTCACGTGA GCCTCTCGCT GCTCCGCAAG 
GTCGAGCAGG GCAGCCGAGA TGCCACGCCA GCACTCATCG CAGCGGTCGC ACGGGCACTG 
ACCATCGACG TGACCGCCCT GACCGGCCAG CCCTACGATC TGGGCGGCCG GCAACTCGAT 
CCGCTTCACC AGCACATCCC CAGGCTCCGA CGTGCGCTCA CATACTGGGA CCTGCCGCCC 
GAGGGCGTCA CGCCACGTTC CCCGGCAGAG CTGGTCCGAG ACGCCGACCG CGCCGCGGAC 
CTTCGCCGAT CCGGCAGCCA CGTCCAACTC GCTGCCGTAC TTCCGGCCCT GCTCACGGAG 
ACCACCGCTG CTATCCACAG CGCTCCGGCC GGACCAGAGC GTGAGCGTGC CTACGCCACC 
CTGACCGTGC TGCTCTTCGC CGCGCACTCC GTCACCTACA AGACGGGATA CATCGATCTT 
TCCACCCTCA TCGAGGAACG CACCCATTGG GCGGCGCTCG CGTCCGCTGA CCCGGTACTC 
GGGGCGCTCG CGGCGTGGAC ACGTACCACG TCCCTGCTCC AGGCTGGTTC TTACGACATC 
GGCCTGCAGC TCCTGGACCG CGCCCAGGCG GAAATTCCCG CCGGCCCCGA ACCGGACGAC 
AGCACCCTGC GGATGTCCGG AGCACTGCAT CTGCGTGCCG CGATGCTCGC GGCACGCAGT 
GGAGACTCCG ATCTGACCAA CGATCACCTT GCCGCTGCGC GCCGGCTGTC TACGCGGCTC 
GGCGATATCG ACCACGACGG CGGCCGTTAC CAGCTTGCCT TCGGCCCGGC CAATACCGGC 
GTGCACGTCG TCGCCGCTGC CGTCGAGCTG GGCGACGGCG ACGAAGCGAT CAAACAAGCC 
AGCCAGGTGC ACATCTCGAC CGGCCTGCCG AAGATCCGCG CCTGCCACCA CTACATTGAC 
CTGGCCCGCG CCTACCTGTG GACCGGAAGA AAAGAGGATT CTCTACGCTG CCTGACGACC 
GCGCGCGAGA TCGCTCCGCA GCAGACCCGT CATCACCCCA CGACCCGCGA GGTCGTGCGG 
ATGCTCATAC GTCTACACCA CCGCAGCAAT ACGCAACTCA CGAAGATGGC AGGCTGGATC 
GGACACGAAT CCTGA

Protein sequence

MDDDQIRGVG ERIADARKAR SFSQRQLAEH AHVSLSLLRK VEQGSRDATP ALIAAVARAL 
TIDVTALTGQ PYDLGGRQLD PLHQHIPRLR RALTYWDLPP EGVTPRSPAE LVRDADRAAD 
LRRSGSHVQL AAVLPALLTE TTAAIHSAPA GPERERAYAT LTVLLFAAHS VTYKTGYIDL 
STLIEERTHW AALASADPVL GALAAWTRTT SLLQAGSYDI GLQLLDRAQA EIPAGPEPDD 
STLRMSGALH LRAAMLAARS GDSDLTNDHL AAARRLSTRL GDIDHDGGRY QLAFGPANTG 
VHVVAAAVEL GDGDEAIKQA SQVHISTGLP KIRACHHYID LARAYLWTGR KEDSLRCLTT 
AREIAPQQTR HHPTTREVVR MLIRLHHRSN TQLTKMAGWI GHES