Gene Franean1_2697 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2697
Symbol
ID	5671088
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3191499
End bp	3192797
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	68%
IMG OID	641241609
Product	putative branched-chain amino acid ABC transporter, amino acid-binding protein
Protein accession	YP_001507029
Protein GI	158314521
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.614277
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATGACA CGGTAGTCCT ACACGGTCAT TCGACGGCGA GGCGGCACCG CCGACGCTCG 
GCGGGCATGC TCTTATCGGC GTCCCTGGCG CTGCTCGTGT TAGCCGCGGC GTGCGGTTCG 
GATGACGGCG GGAGCACGCC CACCACGGTG GATTCATCCG CGGCCGCCGA CGCGCTCGGT 
CCGGTCAGGA AGGCGGCGGG AACCCCCGTC AAGATCGGTA TCGTCTCGGA CGGCAGGTCC 
GCCGCGATCG ACAACTCGGT GCAGTTCGCG GTAGCGAAGG CGACCGCGAA ATACCTGAAC 
GAGCATCGCG GGGGGATCGG TGGTCGGCCC GTCGAGCTTG TGACGTGTGA GACGCAGGCG 
GACCCGGCCA AGGGCACGGA CTGCGGCAAC CAGATGGTCG AGAAGGACGT CGTCGCGGTC 
GCGGTCAGTG AGTCGGCGGT CGGTGACAGC GTCTGGCAGC CGCTGGCCGA CGCTGATGTG 
CCGGCGATGT TATACAGCGC GACCAGCCCG ACGGCCCTCA CCGACCCGAC GACCTTCACG 
GTGACCGATC CGAGTTTCAC GATTCAGCAG CTGCCGATCG CCCTCGCGAA GGAGAAGAAG 
CTCAAGAAGG TGACGTTGGT GGCCATCGAC GTGCCCGCCT TGCTCTACAG CGTCCAGGAG 
GTCGTGCCGA AGCAGATGGC GAAGGCAGGG CTCGACTACC AGCTCATCCG TATCCCACCG 
GGCACAGCCG ACATGACGCC GCAGCTGCAG GGTGTCGCGG GCGGTGACCC AGGGTTGGTG 
TTCGTCATCG GCAACGACTC GTTCTGTATC AGCGCCTTCA ACGGCCTGAG GGCGGTCGGG 
TACGACGGCA GCATCGGCGC GATCTCGCAG TGCATCACCG ACGCGACCCG CAAGGCGGTG 
CCGGGCGACG TGCTGGACGG CATGAGCGTC GCCGCCTCGA TGCCGGCCGG CGGGGATGAC 
CCGTCCAGCG TCCTCTACAA CGCCGTGCTC GAGACCTACG GCAAGGACAT CGATGCCAGT 
TCGTCCACCG GTCGGGGCAT GTTCGCCACC TTCGCGGGCC TCGCGGCAGC GCTTGAGGGC 
ATCAAGGGCG ACGTCACCCC GGCGACGGCC GTGGCCGCCA TCAGATCGAT GCCGGAGAAG 
GAGCTGCCGG GCGCGGGCGG GCTGAAGTTC CGCTGCAACG GCAAGGCCAA CCCCGAGACG 
CCCGCGGTGT GCGTGCGGGG CGGACTGACG GCGAGCCTCG ACAGCGACGG CCAGGCCACC 
GACTTCAACG TGGTCGGGAG CTCTCCGATC CCGGACTGA

Protein sequence

MYDTVVLHGH STARRHRRRS AGMLLSASLA LLVLAAACGS DDGGSTPTTV DSSAAADALG 
PVRKAAGTPV KIGIVSDGRS AAIDNSVQFA VAKATAKYLN EHRGGIGGRP VELVTCETQA 
DPAKGTDCGN QMVEKDVVAV AVSESAVGDS VWQPLADADV PAMLYSATSP TALTDPTTFT 
VTDPSFTIQQ LPIALAKEKK LKKVTLVAID VPALLYSVQE VVPKQMAKAG LDYQLIRIPP 
GTADMTPQLQ GVAGGDPGLV FVIGNDSFCI SAFNGLRAVG YDGSIGAISQ CITDATRKAV 
PGDVLDGMSV AASMPAGGDD PSSVLYNAVL ETYGKDIDAS SSTGRGMFAT FAGLAAALEG 
IKGDVTPATA VAAIRSMPEK ELPGAGGLKF RCNGKANPET PAVCVRGGLT ASLDSDGQAT 
DFNVVGSSPI PD