Gene Franean1_5025 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5025
Symbol
ID	5673363
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	6018806
End bp	6020251
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	70%
IMG OID	641243879
Product	hypothetical protein
Protein accession	YP_001509294
Protein GI	158316786
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.898737
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.21169
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGTCCCTC TAGCTTCCTG GGATCCTGAC CAGCTGAGTC TCTACGGTTG GCTGGAAAAC 
CAGATCCTGC GCGAGTACCC ACACCTGTCC GCCGTAGATG CGGCCACCGG GCACAGTCGC 
GCCGCGGCGC TGCTGCACGC TGGGCTGATC CTTCCTGTCC TCGACGGGCT CGATGAGATC 
CGCGTGGGCG GCAGGGACCA GGCCCTGACT GCTATCAACG ACGGCCTGCG CAGCAACATC 
GGACTCGTTC TGAGCTGCCG CGCCGAGGAG TTTCGTGCGG CCGTGCAATC CGAGCCCGAC 
TGGCAGCCAA TCCACCTCGA CGGCGCCGCT GGCATCCGCC TAACGCCGCT CACTTCGGCA 
GTGGTCGGGG ACTACCTTCT AGCCGGATCT GGCAACAACG GTTTCACCAG ATGGGAACAG 
GCCCTCACCG CGCTGGCTGA CCCCACCACG TCCCTCGGCC AGGCGCTTTC CACCCCACTA 
GCCGCCAGCC TCGCCCGCAC CATCTACAAC CCCCGCCCCG GCGAGTTCAT CCGCGGATTG 
CCCGACCCCT CCGACCTGAC CACGTTGCCG ACCCGGCAGG CCGTCGAACA GCATCTCTTC 
GACGGCTACC TGCCTGCCGC CTACCGGGCC CACCCCGACC AGCCCACTCG CTGGACCGCC 
AGCCAGGCCA CCCGCTATCT CGTCTTCCTC GCCCATCACC TCGAACACCG CCTGGAGACC 
ACCGCCCTCT CCTGGTGGGA GCTGTCCCGG GCCACCCCAC GAGCACTTTC GATCCTCGTG 
TACGGGCTCA CCTCCGGGCT CGCATTCGGG CTCGCGGACA GGCCCGCGGT CGGACTCGCG 
CTCGGACTCG TGTTCGGGCT CGCGGTCGGG CCCGCGGTCG AACTCCTGAT TGGCAGCGCC 
TCCCCCGGCC GCATGGCTCT GCGACCGCCG CGGCTGTTCG ACCTGGCGGT AGGGCTCACA 
ATCGGGGTCG CGGTCGGGCT CACGGACGGG CTCATGGACG GGCTGTCGGC CGGGCTGTCG 
ACCGGACTCC CGTTCGGGCT CGCGCTCGGG CTCGTAGTCG GGATCAGACT TGACCCCACG 
GCGGAGACGA GACGGGCGAC AGATCCCAGA ACCATCCTGG TCCAGGACCG GGCCAGCGGG 
CTCGCAATGG GGCTCGTTCT CGGGCTCACG GTCGGGCTCA CCGTGGGGTT CACGGACAAT 
GCGCTCACGG CCGGGCTTCC GGCCGGGCTT CCGGCCGGGC TTACAGCTAC CCTCACATTC 
GCGCTCGGCT CCGCGTGGGG ACGGCTGGGG GTGACCCGCC TGTGGCTTGC CGCGCGGCGG 
AAGCAGCCGC TGCGCCTCAT CGCCTTCCTC ACCGACGCCC ACGATCGCGG CGTCCTGCGC 
CAGGCCGGGG CCGTGTGGGA GTTCCGGCAC GCCAACCTCC AGCGCCACCT TGCGGGTCCG 
CCGTGA

Protein sequence

MVPLASWDPD QLSLYGWLEN QILREYPHLS AVDAATGHSR AAALLHAGLI LPVLDGLDEI 
RVGGRDQALT AINDGLRSNI GLVLSCRAEE FRAAVQSEPD WQPIHLDGAA GIRLTPLTSA 
VVGDYLLAGS GNNGFTRWEQ ALTALADPTT SLGQALSTPL AASLARTIYN PRPGEFIRGL 
PDPSDLTTLP TRQAVEQHLF DGYLPAAYRA HPDQPTRWTA SQATRYLVFL AHHLEHRLET 
TALSWWELSR ATPRALSILV YGLTSGLAFG LADRPAVGLA LGLVFGLAVG PAVELLIGSA 
SPGRMALRPP RLFDLAVGLT IGVAVGLTDG LMDGLSAGLS TGLPFGLALG LVVGIRLDPT 
AETRRATDPR TILVQDRASG LAMGLVLGLT VGLTVGFTDN ALTAGLPAGL PAGLTATLTF 
ALGSAWGRLG VTRLWLAARR KQPLRLIAFL TDAHDRGVLR QAGAVWEFRH ANLQRHLAGP 
P