Gene Franean1_3754 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3754
Symbol
ID	5672119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	4446453
End bp	4447412
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	69%
IMG OID	641242635
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001508055
Protein GI	158315547
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0601] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTCGGT ACGTCCTCGG TCGGTTCGCC CAGGCGCTCG TCGTGCTCTG GGCGGCCTAC 
ACCGTGACCT TCGCGGTCCT CTACCTGCTG CCGAGCGATC CGGTCGCCCT GCAACTGGGA 
GCGGCGGGGA TCGAGACCGA CAAGCTCACC CCTGAGCAGC TCAACACCGC GATGGCCCAG 
TACGGGCTGG ACCGTCCGGT CCTGAATCAG TACTTCTCCC ACCTGTGGGG CTTCCTGCAC 
GGAGACTTCG GTGACTCGAT CTCCAAGCAG CAGCCGGTCG CCGACCTCAT CGGCGACCGG 
CTGGGCCCCA CGGTCGCGCT GAGCATCACC GCCGCCGCAC TCTCGCTCGT GGCCGGGATG 
GCGCTGGCCT ACCTGGCCTC CTACGTGCGG TGGCGGCCGG CCCGGCTGTT CCTGACCCGG 
CTGCCCTCGT TCGGGGCCTC GTTCCCCCAG TTCTTCATCG CGCTGCTGCT GATCCAGCTG 
CTGTCGTTCA ACCTCGGCTG GCTGCCGGCC ACCGGCATCA AGGGCTGGAA GTCGCTGGTG 
ATGCCGTCCA TCACGATCTC GCTGCTGACG GCCTCGATGC TCGCGCAGGT GCTGATGCGC 
AGCTTCGACG ACACGCTCCG CCAGCCCTAC ATCGTGACGG CGCGCGCGAA GGGCCTCTCC 
CGGGCGGCGG TGCAGTGGCG GCACGGCTTC CGCAACGCGC TGCTGCCCGC CCTGACCATC 
CTCGGCGTCC TGGTCGGCCT GACCGTCACC AGCGCGATCG TCGTCGAGAC GGTGTTCTCC 
CGCAACGGCC TCGGCAAGCT CGCCCAGGAA GCGGTGCTGG CGCAGGACGT TCCGGTGGTC 
CTCGCGATCG TCTCGCTGGC GGCCGCCGTC TTCGTCTTCG TCAACCTCGT GGTCGATCTG 
CTCTATCCGT TGCTGGACCC CCGCATCGTG CAGGGCCGGC GGAAGGTGGC CTCATCGTGA

Protein sequence

MTRYVLGRFA QALVVLWAAY TVTFAVLYLL PSDPVALQLG AAGIETDKLT PEQLNTAMAQ 
YGLDRPVLNQ YFSHLWGFLH GDFGDSISKQ QPVADLIGDR LGPTVALSIT AAALSLVAGM 
ALAYLASYVR WRPARLFLTR LPSFGASFPQ FFIALLLIQL LSFNLGWLPA TGIKGWKSLV 
MPSITISLLT ASMLAQVLMR SFDDTLRQPY IVTARAKGLS RAAVQWRHGF RNALLPALTI 
LGVLVGLTVT SAIVVETVFS RNGLGKLAQE AVLAQDVPVV LAIVSLAAAV FVFVNLVVDL 
LYPLLDPRIV QGRRKVASS