Gene Francci3_1592 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1592
Symbol
ID	3903727
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1908918
End bp	1909982
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	68%
IMG OID	637878929
Product	extracellular solute-binding protein
Protein accession	YP_480697
Protein GI	86740297
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.641275
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.651768
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCTGTCC AGGTGGAGGG TTCAGGTGGA GTGTTCAGCT GGAGGAGCCC GATGGGTTCG 
TTAGGAAGAA CCTTGGTCGT GCTGGTGACG GCCACCTGCC TGGCCGGCCT GTCAGCGTGC 
GGCTCGGGGG ACGACGGGAA GACGATCACG CTCTACAACG CGCAGCACCA GGACCTGATG 
CGGGTGATGG TGGACGCGTT CACCAAGCAG ACCGGCATCA AGGTCGAGTT GCGTCGCGGC 
GGCGACCCCG AGCTGGCGAA CCAGATCGTC CAGGAAGGCG ACAGCTCGCC GGCGGACGTC 
TTCGTCACCG AGAACTCGCC GGCCATGACG CTGGTCGACC GCGCCGGCCG CTTCAGCAAA 
CTGGACCGGG CCACCTTGGG CCAGGTGCCT GACCAGTACG TCCCGAGCAC CGGCAACTGG 
GTCGGTTTCG CGGCCCGGTC GACGGTGTTC ATCTACAACC GTGGGCAGGT CGCCAAGAAC 
GAGCTGCCCA CGTCGATCAT GGACCTGGCG GGACCGGCGT GGAAGGGGAA GGTCGGTGTC 
GCGGCGGCCG GAGCGGACTT CCAGGCCATC GTCAGCGCCG TACTCGCGGT GAAGGGCGAG 
GGGGCCACCG CCGAGTGGCT CGCCGGGCTG AAACGCAATG CGAAGATCTA CGACAACAAC 
ATCGCCGCGC TGCGCGCCGT GAACGCGGGC GAGGTCCCCG CCGCTGTGAT CTACCATTAC 
TACTGGTACC AGGACCAGGC GGAGTCGGGC AAGGACAGCA GGAACGTCGA CCTGCACTTC 
TTCGGCCACC GGGACCCGGG CGCGTTCGTC AGCGTCTCCG GCGCCGGCGT CCTCGCGGCC 
AGCGACCAGC AGGCCGAGGC GCAGCGGCTG GTCGCCTTCC TCACCAGCGA CGCCGGGCAG 
AAGGCGCTGG TCGACAGCGG TGCCCTGGAG TACGCCGTGT CCGACGCGGT CCCCACGAAC 
CCTGCGCTGA AGCCGCTGTC GACCCTCGAT CCGCCCGACA TCGACATCTC GACCCTGAAC 
GGACCAAAGG TCGTCGAACT GATGCAGCGG GCGGGCCTGC TCTGA

Protein sequence

MSVQVEGSGG VFSWRSPMGS LGRTLVVLVT ATCLAGLSAC GSGDDGKTIT LYNAQHQDLM 
RVMVDAFTKQ TGIKVELRRG GDPELANQIV QEGDSSPADV FVTENSPAMT LVDRAGRFSK 
LDRATLGQVP DQYVPSTGNW VGFAARSTVF IYNRGQVAKN ELPTSIMDLA GPAWKGKVGV 
AAAGADFQAI VSAVLAVKGE GATAEWLAGL KRNAKIYDNN IAALRAVNAG EVPAAVIYHY 
YWYQDQAESG KDSRNVDLHF FGHRDPGAFV SVSGAGVLAA SDQQAEAQRL VAFLTSDAGQ 
KALVDSGALE YAVSDAVPTN PALKPLSTLD PPDIDISTLN GPKVVELMQR AGLL