Gene Franean1_2041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2041
Symbol
ID	5670442
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	2453734
End bp	2454900
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	74%
IMG OID	641240963
Product	ABC transporter related
Protein accession	YP_001506384
Protein GI	158313876
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0410] ABC-type branched-chain amino acid transport systems, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.247921
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACACCGG ACGGGAACCC CCTCGACGGA TCGCCACTCG AGAACATCGC GCCACTCGAG 
AACATCGCGC CACTCGAGAA CATCGCGCCG CTGGAGAACA TCTCGCCGGT CGACAGCACG 
CTCCCGACCG GGAGCACGCC GCCGACCGGG AGCACGCCGC CGACCGGGAG TGCCTCGCAG 
GTCGGGAGTG CGCCGCAGGT CGGGAGCGTC TCGGCGTTCA GGAGCACGAT TCCGGCCGGG 
ACGTTGGTCG ACCTGACCGT CCCCGAGCGA CCGCTGTTGG ACGTGCGCGA CGCCGAGGTG 
GCCTACGGAG CCGTCACCGC GCTGCGGGGG ATCTCGCTGC GGGTGGACCG GGGCGAGGTG 
GTGGCCCTGC TCGGCGCGAA CGGAGCCGGG AAGACCACCA CCCTGCGGAT GATCTCCGGA 
CTCCTCCCGC CCGCTCGCGG CTCGGTCTGG TTCGACGGCG CCCGCCTGGC TGGCACCGGC 
AGCGGTACCG GGCTCGGTGG CACTGGCACC GACGGCGGTA CCAGTGGGCA CGGCGATACC 
AGCGGGCACG GCGGTGCCGG TGCCTGGTCC GACGGCACGC GGGACTCACC AGGGCTGCCG 
GTGCACCGGG TAGCCGCGCT CGGCATCAGC CACGTGCCCG AGGGACGGCG GATCTTCCCG 
GCGATGACGG TGGCCGAGAA CCTCGCGATG GGCGCCTACA CCGACCGCCA CCGGGCCTGG 
AGCCGTGCCG GCCGCGACGC CCGCCGAGAA GCCCGCCGGG ACGTCCGCCG TGGCCTCGAC 
CGCGTGCACG CGCTGTTCCC ACGCCTCGCC GAGCGGGACC GCCAGCCCGC GGGCACGCTC 
TCCGGCGGGG AGCAGCAGAT GCTGGCGATC GGGCGGGCAC TGATGGCCCG GCCCCGGCTG 
GTCCTGCTGG ACGAGCCCTC GCTCGGGCTG GCCCCGAAAC TGGTCGCGAC GATCTTCGAA 
GTGATCGAGG AGATCAACGC GGACGGGGTG ACCGTCCTGC TGGTGGAGCA GAACGCGGCG 
GCGGCGCTGC GGATCGCGCA CCGGGGCTAC GTCCTGGACA CCGGCCAGGT AGCACTCGCG 
GGCAGTGCTG ACGAGCTGGC CCGCGACCCC CGGGTGCGCG ACGCCTACCT GGGCAGCCCG 
AGCGATTCCG ACGCCGTGGC ACCCTAG

Protein sequence

MTPDGNPLDG SPLENIAPLE NIAPLENIAP LENISPVDST LPTGSTPPTG STPPTGSASQ 
VGSAPQVGSV SAFRSTIPAG TLVDLTVPER PLLDVRDAEV AYGAVTALRG ISLRVDRGEV 
VALLGANGAG KTTTLRMISG LLPPARGSVW FDGARLAGTG SGTGLGGTGT DGGTSGHGDT 
SGHGGAGAWS DGTRDSPGLP VHRVAALGIS HVPEGRRIFP AMTVAENLAM GAYTDRHRAW 
SRAGRDARRE ARRDVRRGLD RVHALFPRLA ERDRQPAGTL SGGEQQMLAI GRALMARPRL 
VLLDEPSLGL APKLVATIFE VIEEINADGV TVLLVEQNAA AALRIAHRGY VLDTGQVALA 
GSADELARDP RVRDAYLGSP SDSDAVAP