Gene Franean1_4487 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4487
Symbol
ID	5672837
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5353769
End bp	5355034
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	69%
IMG OID	641243354
Product	putative high-affinity branched chain amino acid ABC transporter, amino acid-binding protein
Protein accession	YP_001508770
Protein GI	158316262
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCGCC GAACTCGCAA TCTGGCCGTC CTGCTGGGCT TAGCCACCGC CCTGACCGCC 
GCCTGCGGCA GCGCCCCGAA GTCGGACACC GGCGGGGGGG AGACGGGCGC CGCTGACGCG 
GCCGCACTCG GGCCGGTCGT CGCGGCCCCC ACCGGCACCC CGCTCGTCAT CGGCTACATC 
AGCCAGGAGA ACACGGCGGT GGGGTCCTAC CCCGAGGCGC TCGCCTCGGC GCGGGCAGCC 
GCTGACTACA TCAACAAGCA TCTCGGCGGA GTGCACGGGC GGCCCCTCGA ACTGTCTTCC 
TGCGTCACTG ACGGGTCGGT CGCGACTTCG GCGAACTGCG CGCGGCAGAT CGCGTCCACC 
TCCGGCGTGG TCGCCGCCTC AAGCAGCCTC GACTTCGGTG CCCAGGGCGC CGTACCGGTG 
CTCCAGGCTG CCGGCATCCC CCGTATCGGC GGGATCGCGA TCTTCCCGGA GGAGGCGTCT 
TCCCCGACCG TCTTCAACTT CGCGGGCGGT TCCTTCGCGG CCTTCCCCGC GATCGACACC 
TTCGTCGCCA CCGTCCAGAA GGCCGGGCGC GTGAGCGCCC TGACATCCGA CACCTCACCC 
GGCATCGCCT CGGCGAATGA CCAGATCAAG ACTCCGTTGC AGCGGGACCT CGGTTACAAG 
GACGTGCCGA TCGTCGTCGC GGCTCCGGAC GCCGCCGACC TGACCGGCGC GCTGACCCAG 
CTCAACGCGT CCAAGCCGGA CGCGGTGGTG AGCAGCTTCG GGCAGGCGTG CGTGCGCATC 
ATGCAGGCGA AGAAGGCGCT CGCCCTGCCG TTCACGATGT ACCACACCAG TAAATGCCTC 
GACGAGCGTG TGCTGCAGAG CGCGGGCGAG GCCGCCGAAG GGCACCGCTT CAACTCCGAG 
ACGCGGATGT GGAACGAGAA GGACGACGAC GCGGCGATCT ACCGGGCCGC GATGGCGAAG 
TACGCGTCCG GGACGACGCT GAGCAACTAC TCGACGATCG CCTTCCAGGG GATCATGAAC 
ACCTACCGCC TGCTGAACAA GATGGACGAG GCGAGCCTCA CCCCGAAGGC GCTGGTCGAG 
AAGATCCGCA CCACCAGCGA CGAGCCGAGC TTCCTCGGCT GGACCTACAC CTGTGACCCG 
GCGAAGCTCG CCGTGGCCGG CCAGTCCGGC CTGTGCAGCA CCCTAGAGGT GATCGTCGAG 
GTGAAGAACG GCGTTCCGAC CACCATCTCG GACCCGATCG ACGGCTCGAA GCTCCTGCGG 
CTCTGA

Protein sequence

MMRRTRNLAV LLGLATALTA ACGSAPKSDT GGGETGAADA AALGPVVAAP TGTPLVIGYI 
SQENTAVGSY PEALASARAA ADYINKHLGG VHGRPLELSS CVTDGSVATS ANCARQIAST 
SGVVAASSSL DFGAQGAVPV LQAAGIPRIG GIAIFPEEAS SPTVFNFAGG SFAAFPAIDT 
FVATVQKAGR VSALTSDTSP GIASANDQIK TPLQRDLGYK DVPIVVAAPD AADLTGALTQ 
LNASKPDAVV SSFGQACVRI MQAKKALALP FTMYHTSKCL DERVLQSAGE AAEGHRFNSE 
TRMWNEKDDD AAIYRAAMAK YASGTTLSNY STIAFQGIMN TYRLLNKMDE ASLTPKALVE 
KIRTTSDEPS FLGWTYTCDP AKLAVAGQSG LCSTLEVIVE VKNGVPTTIS DPIDGSKLLR 
L