Gene Francci3_0341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0341
Symbol
ID	3905186
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	395347
End bp	396516
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	67%
IMG OID	637877670
Product	extracellular ligand-binding receptor
Protein accession	YP_479457
Protein GI	86739057
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTAGGC GCCCGCTCCT GGGAGCGATA GCCCTTGCCG CGACCGTGGC GTTGACCGCG 
GCGGCCTGTG GAAGTGACAG TGGTTCGTCC TCGAACGGGA AGCAGACCAT CACGATCGGC 
TTCCAGGGAG TTCTCTCGGG CGACAGCCAG CAGCTCGGTC TGAACGCCCT CTACGGCGTC 
CGGACGGCGA TCGCCGAGGT CAACGCGGAT GCGAGCGCGC CGTTCCAGCT CAAGCTCGTC 
GAATCCGACG ATGGCGGCTC GCCGGATCAG GGCCCGACGG CAGCCCAGAA GCTGATCGAT 
GACTCCAAGG TCGTCGCGGT GGTCGGCCCG ATGTTCTCCG GCGCCACCAA GGCGAGCGAG 
CCGGCCTACA CCCAGGCCGG GCTGCTGTCG GTGAGCCCGT CGGCGACGAA CCCCGCGCTC 
ACCACCCTGG GCTTCAAGAC CTTCTACCGG GTCATCGCCC CGGACACCGT GCAGGGCAAG 
GCCGCGGCCG ACTACATCGC CACGGTGCTC AAGGCGACGA AGGTGTACTC GCTGGACGAC 
AAGAGCGAGT ACGGCACGGG CCTGTCGGGT GCGCTGGAGG CCGAGCTCAA AGCCAAGGGT 
GTCAACGCGA CCCACGACGG CATCAACCCG ACCAAGGACT ACACCTCCGA GGCAACGAAG 
ATCATCGCTG CCGCGCCCGA GGTCCTCTAC TACTCCGGCT ACTACCCCGA GTTCGCGCTG 
CTGTCGAAGG CGCTGAAGGG CAAGGGCTTC ACCGGAAAGA TCATCAGCGG TGACGGCTCG 
CTCGACCCGC AGTACGTCGC GCAGGCCGGG GCCGCCGCGG CCGAGGGTGC CTACCTCACC 
TGCCCCTGCG GCGACGCCAA CACCGACCCG AAGGCCGCGT CCTTCGTCGC GTCCTACAAG 
AAGGTCAACA ACGGGACGAA GCCCGGCACC TACTCCGGTG AGGCCTACGA CGCCACGCTC 
GCCCTCGCGG ACGTCTTCAA GAAGCTCGGC AAGGACGTCA CCCGGGAGTC CGTGACCGGC 
GCGTTCGGTT CCGTGAACTT CCCCGGCATC ACCAAGACCG TGGTGTTCGA GCCCAACGGC 
GAGGTCAAGG GCTCCAACGT GTTCGTCTAC CAGGTGAAGG GTGGACAGAT CACCGTTCTC 
GGCAACATCG CGAACCTGGT CAAGTCCTGA

Protein sequence

MGRRPLLGAI ALAATVALTA AACGSDSGSS SNGKQTITIG FQGVLSGDSQ QLGLNALYGV 
RTAIAEVNAD ASAPFQLKLV ESDDGGSPDQ GPTAAQKLID DSKVVAVVGP MFSGATKASE 
PAYTQAGLLS VSPSATNPAL TTLGFKTFYR VIAPDTVQGK AAADYIATVL KATKVYSLDD 
KSEYGTGLSG ALEAELKAKG VNATHDGINP TKDYTSEATK IIAAAPEVLY YSGYYPEFAL 
LSKALKGKGF TGKIISGDGS LDPQYVAQAG AAAAEGAYLT CPCGDANTDP KAASFVASYK 
KVNNGTKPGT YSGEAYDATL ALADVFKKLG KDVTRESVTG AFGSVNFPGI TKTVVFEPNG 
EVKGSNVFVY QVKGGQITVL GNIANLVKS