Gene Franean1_5646 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5646
Symbol
ID	5673973
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	6859215
End bp	6860435
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	74%
IMG OID	641244500
Product	putative HTH-type transcriptional regulator
Protein accession	YP_001509903
Protein GI	158317395
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGAGG GAGCTTCCGG CGGCATGACG GCGGGCGAGC GGGAGTGGCT GCGGGTCCGG 
GGCGAGCTGA AACGGCGGCG GCACCCGCTC GCCGTCCTGG CGGCACAGGA GTACCCGCCG 
GACGCGCGGG TCGCCGGCAC GCCGCTGCTG GCGGCACCGG GGTGGATCCC GCCGGAGCCG 
GTGCCGATCG ACTCGGTGGT GATCGACCTC GACCCGGGTC GGGAGCAGTC CGGCGGGCTG 
ACCGGGCGGG AGCCGGTGAG TGAGGGCGTC CGGCCGCTGC GCGCGGATGG CAGCCGTTAC 
GGCGGCTACG CGGCGGCGGT GGCCCACCTG GACCGGCCGG CGCTGTTCGT CGATCTCCCC 
ACCTACCGGC TGTGCGACGC CGACCTGTCA CTGCCGGGGG CGTGCGGCAC CCTGTCGTTC 
GGGCTCGGCA GCTATTTCGA CGGGCTCGAC GTCGGCGAGG CCTGCGCGCA CGAGTACGCG 
GCCGCCGCTC AGGGCGCGGA GGGTCTTCCT GTGCGGCGGG CGGTGGGCAT GCCCTGGGAG 
CTTCACCGGC GGCCGGCGAG CATGGCCATC AGCACCCTGA CGATCCGCCG GGATCGCCGG 
ACGGAGACGG CGACCGTGCT CCTCCACCGC CGGGACCCGG CGAAGGTGGG TCACGCCGGT 
GGTCTGCTGC AGGTGGTGCC GGTCGGAGTG TTCCAGCCCT CCGGGCCGGC GGAGTGGAAC 
ATCCGCAACG ACTTCGACCT GTGGCGGTCG ATCACCCGCG AGTACTCCGA GGAGCTCCTG 
GGCACGGCCG AGGAGTACGG CAGCGACACG CGGCCCATCG ACTACGGGCG CTGGCCGTTC 
GCGGCGAATC TGGCCGCGGC CCGGCAGTCG GGCGCGGTGC GGGTGTCCGT GCTCGGGCTC 
GGTGTGGACC CGCTGACCTT CGCCACCGAC CTTCTCACCG TCGCGGTCTT CGACGCGCCG 
GCCTTCGACG AGCTGTTCGC CGGCCTCGTC GGCACGAACG CGGAGGGCGA GAACCTCTCG 
CGATTGGACG CCTCCAGGCC AGCCGTCTCT GAGCCCGACC GCGCCGGCAC CGCCACCGGC 
CCGCAGCCAG AACGCCGGAC CCCGGGGATC CCCTTCACCG AGCGGACCGT TGACCGGCTG 
GTCCACCACG AACCGATGCA GGCCGCCGGC GCCGCCCTCA TCGCTCTCGC CTGGCGCCAC 
CGGCGCCACC TGCTGGGCTG A

Protein sequence

MSEGASGGMT AGEREWLRVR GELKRRRHPL AVLAAQEYPP DARVAGTPLL AAPGWIPPEP 
VPIDSVVIDL DPGREQSGGL TGREPVSEGV RPLRADGSRY GGYAAAVAHL DRPALFVDLP 
TYRLCDADLS LPGACGTLSF GLGSYFDGLD VGEACAHEYA AAAQGAEGLP VRRAVGMPWE 
LHRRPASMAI STLTIRRDRR TETATVLLHR RDPAKVGHAG GLLQVVPVGV FQPSGPAEWN 
IRNDFDLWRS ITREYSEELL GTAEEYGSDT RPIDYGRWPF AANLAAARQS GAVRVSVLGL 
GVDPLTFATD LLTVAVFDAP AFDELFAGLV GTNAEGENLS RLDASRPAVS EPDRAGTATG 
PQPERRTPGI PFTERTVDRL VHHEPMQAAG AALIALAWRH RRHLLG