Gene Francci3_1620 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1620
Symbol
ID	3905899
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1943946
End bp	1945151
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	67%
IMG OID	637878958
Product	extracellular ligand-binding receptor
Protein accession	YP_480725
Protein GI	86740325
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.368561
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.738285
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGGTC CTGGACGGCG AGGGGGCGTG CCCCGACCGA GCGTGACGCG GTGGGGGGCC 
CTCGGATCCG TGGGTGTGCT GACAGCCGCG GCCGTCCTTG CCGGCTGCGG CGGTGGTTCG 
TCCGGTGACG ACGGGAAAAA GGAATACGCC ATCGGTTTTC AGGGGCCGCT CTCCGGCGAC 
AACCAGCAGC TCGGCATCAA CGCCTACGAC GGGGTGCTGA CCGCTGTCGA GCTAGCGAAC 
CGGCGCAAGG ATCTGCCGTT CAGGCTGCGC CTGGTCGCCT CGGACGATCA GGGTATGGCC 
GAGCAGGGGC CCACCGCCGC GCAGAAACTG ATCGACAATC CGGAGGTCAT CGGCGTCGTC 
GGCCCCGTCT TCTCCGGACC GACGAAGTCG AGTGAGCCGC TCTACAGCGG GGCCGGGCTG 
CTGTCGGTCA GCCCGTCGGC CACCAATCCG GCGCTCACCG ATCTCGGGTT CACCAGCTTC 
TACCGGGTCA TCGCACCGGA CACCGTGCAG GGATCCGCCG CCGCGGAATA CCTTGCCAAG 
GTCGTGAAGG CGGACAAGGT CTACTCTCTC GACGACCGGA GCGAATACGG CACCGGCTTG 
TCCGGAGCGC TCGAGAAGGC CCTGACCGGC CGTGGCATCC GCGTGATCCA CGACGGCATC 
AATCCGACGA AGGACTACAC GTCCCAGGCC ACGAAGATCC TCGCCGAGAA TCCGGACGCC 
GTGTACTATT CTGGCTACTA TGCGGAACTC GCGTTGCTGA CCAGGGCGCT GCGCAGCAAG 
GGGTACACCG GGAAGGTCGT CAGCGGCGAC GGCGCGAACG ACGACCAACT CATCCACCAG 
GCCGGTGCCG GCAACGCCGA GGGAACGCTG CTGACCTGCC CCTGCGGTGA CCCGAACAGC 
GATCCCGCGG CGGCGGGGTT CGTCGCCGAC TACAAGACGA TCAACGCCGA CGCGCGGCCT 
GGAACCTATT CCGGCGAGGC TTATGACGCC ACGAACGCCG TCATCGAGGT GCTGCGCCGG 
CTCGGTAGCG GCGCGACGCG GGAGGCCGTG CTCGCCCGGT TCGGCTCGGT CGACATTCCT 
GGCGTCACCA AGCGCATCAG ATTCCGGAAG AATGGTGAGG TCGAGGGCTC GACGGTCTAC 
GTGTACGAGG TCCGGGCCGG GAAACGGGCC GTGCTCGGCC CGGTCAGCTC CCTCGTCAGA 
CCGTAA

Protein sequence

MTGPGRRGGV PRPSVTRWGA LGSVGVLTAA AVLAGCGGGS SGDDGKKEYA IGFQGPLSGD 
NQQLGINAYD GVLTAVELAN RRKDLPFRLR LVASDDQGMA EQGPTAAQKL IDNPEVIGVV 
GPVFSGPTKS SEPLYSGAGL LSVSPSATNP ALTDLGFTSF YRVIAPDTVQ GSAAAEYLAK 
VVKADKVYSL DDRSEYGTGL SGALEKALTG RGIRVIHDGI NPTKDYTSQA TKILAENPDA 
VYYSGYYAEL ALLTRALRSK GYTGKVVSGD GANDDQLIHQ AGAGNAEGTL LTCPCGDPNS 
DPAAAGFVAD YKTINADARP GTYSGEAYDA TNAVIEVLRR LGSGATREAV LARFGSVDIP 
GVTKRIRFRK NGEVEGSTVY VYEVRAGKRA VLGPVSSLVR P