Gene Franean1_3872 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3872
Symbol
ID	5672235
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4602129
End bp	4603055
Gene Length	927 bp
Protein Length	308 aa
Translation table	11
GC content	72%
IMG OID	641242750
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001508170
Protein GI	158315662
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0600] ABC-type nitrate/sulfonate/bicarbonate transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0743241
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0892137
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACC TGCTGCCCTC GGGCGCGTCC CGCGCCGGGG CGCCCGACCT GGCCGGCGGG 
GGGCCTGGTC TGGCCGGGGC GGCCGCCGCT CCGGGCGCCG GGGCGGACCT GCCGCCGGCG 
CCCGGCCTCG TCCGCCCGCG GGCGTCACGG CGGCACACGC ACGGGCGCGG GGCGTCACTG 
GCGCTGCGCG CTCTGCTGCC CCTCATCCTG TTCGGCCTGT GGTGGTGGGG CACCGAGGCG 
GGCTGGATCT CGTCCGACGT TCTCGTCTCA CCCCCGCGGA TGGTCGAGAC CTTCGGTGAC 
CTGGTGCGCG AGGACGAGTT GTTCCACCAG GTGTCGGTGT CGCTCGACCT GGCCCTGCGC 
GGGGCGCTGT TCGGGGCAGC GGCCGGTTTG CTGTTCGGTG TCGTCGCCGG CCTGTGGCGG 
ATCGGCGAGG AGCTGCTCGA CGCGGTGCTG CAGATGCTGC GGACCATTCC CTTCCTCGCG 
GTCGTGCCGC TGTTCATCGT CTGGCTCGGC ATCGGCGACC TGCCGAAGGT GTTGCTGATC 
TCGCTCGCCA CGCTGTTCCC GATGTACCTG AACACCTACA ACGGTGTCCG CAACGTGGAC 
CGCCGGGTCA TCGAGGCCAT GGAGGTGTTC GGCCTGCGCG GGGCCCGGCT CGTGCTCACA 
GTGATCATTC CGCTGGCGCT GCCGTCGATC CTCACCGGGC TGCGGTACTG CCTCGGGATC 
TCCGTCCTCG CGCTCATCGC CGCCGAGCAG ATCAACTCCA GCGCCGGCCT CGGCTACCTC 
ATGTACCAGG CGCAGTCGAT GCAGCAGGTC GACGTCCTGG TGGTGGTGCT GGCCATCTAC 
GCCGTGCTCG GGCTCCTGTC GGACCTGGTG GTCCGGGTGC TCGAACGCCT GCTGATGCCG 
TGGCACCGCG GCCTGGCCGT CCGATGA

Protein sequence

MTDLLPSGAS RAGAPDLAGG GPGLAGAAAA PGAGADLPPA PGLVRPRASR RHTHGRGASL 
ALRALLPLIL FGLWWWGTEA GWISSDVLVS PPRMVETFGD LVREDELFHQ VSVSLDLALR 
GALFGAAAGL LFGVVAGLWR IGEELLDAVL QMLRTIPFLA VVPLFIVWLG IGDLPKVLLI 
SLATLFPMYL NTYNGVRNVD RRVIEAMEVF GLRGARLVLT VIIPLALPSI LTGLRYCLGI 
SVLALIAAEQ INSSAGLGYL MYQAQSMQQV DVLVVVLAIY AVLGLLSDLV VRVLERLLMP 
WHRGLAVR