Gene Franean1_1336 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1336
Symbol
ID	5669747
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1608465
End bp	1609562
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	70%
IMG OID	641240267
Product	hypothetical protein
Protein accession	YP_001505694
Protein GI	158313186
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGCCA CCACGTCCAC GGCCGCGACA CCCTCGACGT TCGACATCGT CGCCGCGCGC 
TTCCCCCTCG TTCCCCGCTC CCGGCCATCC TGTCCACCCC TTGATGCCCG AATCGCCCAC 
GTCGCCGCCC TCGCCGGCCA AGCCGCCGGG GGCGGCGGCG ACGCGCTGCT GCGCGCGGCC 
GAGGCGCACA ACCTCGCAGC GCTGATCGCC AGCGACTGCG GACTGCCTGA CCTCGCACGA 
AGCCTCTGCT GGCGCCAGAT CGACACCCTC CCGCTCCGCC GCCCACTCGA CGGAGCGACG 
GCGAAACTCG CCCTCCAACC GTTCATCAAC CTGGCGCGCC TGCGGCTGCG CGCGGGCGAT 
GGCCTGGCCG CGTACCAGAT GCTCACGACG CTCTACGACG TCGTCGTGGC GAGGACCAGC 
ACCGCCATCG ACGAACGAGC ACTCGTGTTC GACGACCTCG TCACCGATGT CGACCACCCA 
CAGACCGTCC GCTGGCTGTG GACCGTCCTG CTCGCCGACG GCACCCGCGC CCTGACCCGA 
ACCGGCCACT GGACCGAGGC CCTCGACCAC CTCAACCGCC ACAAGGGCAT CGGACAGCGC 
CTCCTCGACG GCCGCCAGAC CGCGATCCTT GCCCACCACG CCCACCGAGA CCATTACGCC 
GCCGAGCACC TGCTCACCAC CACAGCCACC ACCCAGCCCT GGGAGCAATC CGTCGCCACC 
TGCCTCGGCC TCCTCCACAG ACACCTCACA GGTCTCAAGA CCCCTGACGA CGGCAGGAGC 
ACGATCGATG CGCTCCTCCC GTCGAACAAC CCCGAGCACC TGACGTTCAA CATCCAGCTC 
GGCCTGTGCC TCCTCGACCT CGCGGACACC CCCCAGCATC TGAGGCCGGT CCTCGACACG 
ATCATCGACG GCGCCCTGCA CAGCGACGAT GCCTACGCCG CCCGAGACCT ACTCACCCAC 
CCAGCCGCCC GCGGGTACCT CAACCGCGAC CAGCTGACGC TTCTGAACGA AAGACAGCGA 
CACTCCGGGC TCGGTAGCGG CCGCATCCCC GAAGCGCTCC GCACACGGCT CCTCGGCGCC 
CTCGCGCTCG CCAGCTGA

Protein sequence

MAATTSTAAT PSTFDIVAAR FPLVPRSRPS CPPLDARIAH VAALAGQAAG GGGDALLRAA 
EAHNLAALIA SDCGLPDLAR SLCWRQIDTL PLRRPLDGAT AKLALQPFIN LARLRLRAGD 
GLAAYQMLTT LYDVVVARTS TAIDERALVF DDLVTDVDHP QTVRWLWTVL LADGTRALTR 
TGHWTEALDH LNRHKGIGQR LLDGRQTAIL AHHAHRDHYA AEHLLTTTAT TQPWEQSVAT 
CLGLLHRHLT GLKTPDDGRS TIDALLPSNN PEHLTFNIQL GLCLLDLADT PQHLRPVLDT 
IIDGALHSDD AYAARDLLTH PAARGYLNRD QLTLLNERQR HSGLGSGRIP EALRTRLLGA 
LALAS