Gene Franean1_3478 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3478
Symbol
ID	5671849
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	4135581
End bp	4136531
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	72%
IMG OID	641242366
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001507786
Protein GI	158315278
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0601] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.112233
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.156031
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACCCGG CCATCCGTCT GGTGGCGGTC CGCCTGCTCG GCGCCGTCCT GGTCATCTGG 
GGCGCGGTCA CCGCCGCGTT CGTGGTGCTC CAGCTCATAC CCGGGGACCC GATCAACGCG 
ATCATCGGAA CGCACGCGCT GGTCGGGCCG GAACAGCGTG CTCAGCTCCG GGCCGAATAC 
GGCCTGGACG ACTCGCTGTT CGCGCAGTAC CTGGACCACA TGGGACGGCT GGCCACCGGT 
CGCCTCGGCG ACTCCTACCA GCTCCAGCAG CCGGTCTGGA CAGTGATCAC CGACCAGGCC 
GGCGCCACCG TCGAGCTCGC CGGATGGGCG ATGTTCTCCG CGGTGGTGCT CGCCGTGGCC 
GTGACCCTGC TGACCTCCGG GCGGGCCCGC TGGCCGCGCC GGATCAGCTC GCTGCTGGAG 
CTGGTCGTCG TCTCCACACC CCAGTTCTGG CTGGGGATCC TGCTGCTCAC CGTCTTCTCG 
TTCCATCTCG GCTGGTTCCC GGTGGCCGAC ACCGGGGACC CGCGTTCGCT GATCCTGCCG 
GTGGTGACCC TCGCGCTGCC GATCGCGGCG GTGCTCATCC AGGTGATGCG CGAGGGGCTG 
CTCTCCGCTC TGGAGGCGCC CTTCGTGCTG ACCGCGCGGG CCCGCGGCAG CGCCGAGTAC 
TCGGTGCGCG CGCGACACGC GCTGCGGCAC GCGAGCCTGC CCGCGCTGAC CCTGTCGGGC 
TGGTTCGTCG GCACGCTGCT CGGCGGGGCC GTGATCACGG AGAACGTCTT CGCCCGCTCC 
GGCATCGGGC GGGTGACCCT GCAGGCGGTC GCCAACCGGG ACTTTCCAGT CGTGCAGGGG 
GTGGTCGCGC TGTCGGCGGT GGTGTTCGTC GCCGTCAGCG CCCTGCTGGA ACTGCTGTAC 
GCGGTGGTCG ACCCGCGGCT GCGCAAGCGG ACGGGGGTGG CCGCGGCATG A

Protein sequence

MHPAIRLVAV RLLGAVLVIW GAVTAAFVVL QLIPGDPINA IIGTHALVGP EQRAQLRAEY 
GLDDSLFAQY LDHMGRLATG RLGDSYQLQQ PVWTVITDQA GATVELAGWA MFSAVVLAVA 
VTLLTSGRAR WPRRISSLLE LVVVSTPQFW LGILLLTVFS FHLGWFPVAD TGDPRSLILP 
VVTLALPIAA VLIQVMREGL LSALEAPFVL TARARGSAEY SVRARHALRH ASLPALTLSG 
WFVGTLLGGA VITENVFARS GIGRVTLQAV ANRDFPVVQG VVALSAVVFV AVSALLELLY 
AVVDPRLRKR TGVAAA