Gene Franean1_6151 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6151
Symbol
ID	5674472
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7483214
End bp	7484563
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	75%
IMG OID	641245003
Product	putative transcriptional regulator
Protein accession	YP_001510401
Protein GI	158317893
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0764047
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.610732
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGACGG ACAATGCCCA CGCCTGCACC CATCCCCTCG CCTTCGTCCG CGCTCAGCGT 
GGGTGGTCCT ACCAACGGCT GGCACGCGTC GTCGCGCGTC GGGCCCGAGA TCTCGGGGTC 
GCGAACATGG CCGCCGAGCG GCAGAAGGTC TGGCGCTGGG AGCACCGCGG TGTTGTGCCG 
GACCGGGTCT CCCAGCTGGC GCTCGCCGCC GAGCTCGGGG TCCCGACCGA CCGGCTGGAG 
TCCCACCCGT GGCCGTCCTG GCTGCCGACC GGTGACGCCG TGCGCACGGA GTACCCGTGG 
ACGGCCTCGG GCAGCGTCAC CTCGCTCATG GACGTCGTCG AGGACGCGCT GACCGACCGC 
CGCGGCTTCC TGACCATCAC CGGGCCCGGT GTCGCGTCGC TGTCGTCGGA GTGGCTCGGC 
CTGGAGCCGG CCCGGCTGCA GGTCGCGCTC GCCGGCGGCC AGGTGGACGA GCAGATCGTC 
AACCGGATCG AGCACAACAT CCCCGGCCTG CGGGTGATGG ACGAGCGTCT CGGCGGGGAG 
AGCGTGCGGC GGCTGGTGGA CGCCGAGCTC GGCGTGGTCG CAGACCTGCT CGCCCGCGGC 
TCCTACACCG AGGCGATCGG CCGGCACCTG CACCTGGTCG CGGCCGAGCT CGCCCGGTTC 
GCCGGCTGGG TCTCCTTCGA CGCAGGCTTC CAGACCGCGG CGCAGCGGTA CTGGGTGACC 
GCGCTGCACG CCGCGCACGC CGCGGGGGAC CGGATGCTCG GCGCGAACGT CCTGAAGAAC 
ATGTCGCTGC AGTGCGTGGA CTTCGCCCGG CCGCGTGAGG CGGTCGACCT GGCGGAGGCC 
GCGGTCGCCA GCGCGCGGCG GGCGACCGGC CGGGTCGCGG CGATGCTGCA GATGCGCCGG 
GCCCGCGCGC ACGCCGCGCT GGGCGAGGCC AGCGCCTGCG CCCAGGCGCT GGCCTGCGCC 
GAGGCGGCGT TCGTCGAGGC ACGCGCGGAG GACCCGGCCT GGTCGGCCTA CTTCGACGAC 
GCCGAGTACC AGGCGCAGGT CGGCAGCTGC TACATCGACC TCGGCCACCT CGTGCACGCC 
GATCGCTGGC TCGAGGGCTC GCTGGCCATC CACCCGCACG AGCGCACCCG GGACCGCGCG 
ACCTACCTGT TGCGGCGGGC CGCCGTCCAG ATCGACCTGG GCAACCTCGA CGGCGGGTGC 
TCGCTGGCGA AGGAGGCCCT GCCGATGCTG GAGGCGACCC GGTCGAAGCG GAACAGCCGG 
CGTGCCGACG AGGTCCGGCG GCGGCTGCGC CGGCACTCGT CGGACCCGGC CGCGCGTGAG 
CTCGACCAGG TACTGGCCCG CACGGCCTGA

Protein sequence

MLTDNAHACT HPLAFVRAQR GWSYQRLARV VARRARDLGV ANMAAERQKV WRWEHRGVVP 
DRVSQLALAA ELGVPTDRLE SHPWPSWLPT GDAVRTEYPW TASGSVTSLM DVVEDALTDR 
RGFLTITGPG VASLSSEWLG LEPARLQVAL AGGQVDEQIV NRIEHNIPGL RVMDERLGGE 
SVRRLVDAEL GVVADLLARG SYTEAIGRHL HLVAAELARF AGWVSFDAGF QTAAQRYWVT 
ALHAAHAAGD RMLGANVLKN MSLQCVDFAR PREAVDLAEA AVASARRATG RVAAMLQMRR 
ARAHAALGEA SACAQALACA EAAFVEARAE DPAWSAYFDD AEYQAQVGSC YIDLGHLVHA 
DRWLEGSLAI HPHERTRDRA TYLLRRAAVQ IDLGNLDGGC SLAKEALPML EATRSKRNSR 
RADEVRRRLR RHSSDPAARE LDQVLARTA