Gene Franean1_3921 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3921
Symbol
ID	5672282
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	4688805
End bp	4689704
Gene Length	900 bp
Protein Length	299 aa
Translation table	11
GC content	69%
IMG OID	641242800
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001508217
Protein GI	158315709
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG1173] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0195881
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACCC CCGACGTGGT GGACCGCGAG GTCCACTTAC CGCCGGCCCC GGCGCTGGAC 
ACGCCGATCG TCCCGGCGGT GCGAAAGTCC CGCTCGATCC TGGTGTACCT GGCCTACGCC 
TGGCTGATCG CGGTGATCGC GCTCGCCGCG CTGGCGGACG TGCTGCCGCT GGCGTCGTAC 
TCCATTCCCA TCGGGAAGCC GCGCCAGGGA CCGGATTTCA GCTCGTTCGA CCTGTGGCTG 
GGCACCGACC AGCAGGGCCG GTCGATCCTG TCGCGATGCG TGTACGGTGC GCGCGTCTCG 
CTCCTGGTCG GAACCGTGGC GGGCCTCATC GGGGCCGTCA TCGGAACCCT GCTGGGCATG 
CTCGCCGGCT ACCTCGGCAA GGCCGTCGAC TGGATCATCC GGCTGATCAC CGACGCGATG 
CTGGCGTTCC CGCCACTGAT CCTGCTCCTG GCGCTGTCGT CCATCCTCAC GCCGAGCGTG 
CGGACGCTGC TGGTCGGCCT GACGCTGCTG ATCATCCCGA CGTTCGTCCG GCTCGCGCTG 
GCGAACACCC TCGCCTGGTC GTCCCGCGAG TTCGTCACCG CCGCCCGCAA CATGGGCGCG 
GGGCACGTGC GGATCCTGGT GAAGGAGATC CTGCCGAACC TGCTGCCACC ACTGGGCGCG 
TTCCTGCCGG TCGTGATGGC CGCGCTGATC GTGGCCGAAG GGTCGCTGAG CTTCCTGGGG 
ATGGGCATCC CGCCGCCCCA GCCCAGCTGG GGCGGCATGA TCTCCGACGG CAAGGAGGCC 
ATCGCCGACT CCCCGCACAT GGTGCTGGTG CCGGCGATCG TCATCTTCTT CACCGTCTTC 
GCGCTGAACC AGGCGGGCGA CCACCTGCGC AGCCGCTTCG ACCGCACGAT GCGCGACTGA

Protein sequence

MTTPDVVDRE VHLPPAPALD TPIVPAVRKS RSILVYLAYA WLIAVIALAA LADVLPLASY 
SIPIGKPRQG PDFSSFDLWL GTDQQGRSIL SRCVYGARVS LLVGTVAGLI GAVIGTLLGM 
LAGYLGKAVD WIIRLITDAM LAFPPLILLL ALSSILTPSV RTLLVGLTLL IIPTFVRLAL 
ANTLAWSSRE FVTAARNMGA GHVRILVKEI LPNLLPPLGA FLPVVMAALI VAEGSLSFLG 
MGIPPPQPSW GGMISDGKEA IADSPHMVLV PAIVIFFTVF ALNQAGDHLR SRFDRTMRD