Gene Francci3_1991 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1991
Symbol
ID	3903699
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2340804
End bp	2341976
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	65%
IMG OID	637879327
Product	methionine synthase, vitamin-B12 independent
Protein accession	YP_481094
Protein GI	86740694
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0620] Methionine synthase II (cobalamin-independent)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTCA GCAGCGACCG CATCCTGACC ACGCACACCG GCAGCCTGCC CCGACCGGCC 
GGGCTGGCCG AGCTGATCCG GGCCCGGGAA CAGGAGACCC TCTCGGTCGC GGACGCCGAG 
TACCTGCCCG AGCGGATCGC GGACGCGGTT GGCGTGGTCG TCGGCCATCA GGCGCAGGTC 
GGGCTGGACG TGATCAGCGA TGGCGAAATG AGCAAGATCG GGTACGCCAC CTACGTCAAA 
GAACGCCTCA CCGGTTTCGA CGTGGACGTT GCCGTTCCCG AGGGCGGCGG CCTGTCGATC 
GCTGATCTGG ACGACTACCC TGGCATGGCC GAACGTTCCC TGGCCGGCTT GGAGACCGCG 
ACACCGACCT GTACCGGTCC GATCAGCTAC ACCGGCACCG CCTTGCTCGA TACCGATCTG 
GCCAACTTCG CAGCCGGCGT CAGCTCAATC TCGGCAGGAT CGGGTCAGCC GACCGAGCGG 
TTCATGAATG CCGCGTCACC TGGAGTTATC GCGCTCTATC TTCCGAACCA GTTCTATGCC 
AGTTTGGATG AGTACCTGTT CGCGTTGGCC GAAGGAATGA GGGCCGAGTA CGAGGCGATC 
ACCGCAGCCG GGCTGGTCCT GCAGATCGAC GCCCCGGATC TGGCGATGGG TCGGCACATC 
CAGTACGCGC ACCTGTCCGA GCAGGGATTC CTGGACCGGC TGCGCGTGCA CGTTGAGGCG 
ATCAACCACG CGCTACGCAA TATCGACCCG GCGAGGGTGC GGGTGCACCT GTGCTGGGGC 
AACTACCAGG GCCCGCACCA CAAGGACGTC GGCCTGGACG TCATCCTGGA CACGATCATT 
CAGCTCAAGG CCGATGGGCT GGTATTCGAG GCCGCCAATC ACCGCCACGC ACATGAATGG 
CAGGTGCTGG CCGACGCGAA GATTCCCGAG CAGAAGGTCC TCATCCCGGG TGTCATCGAC 
ACCTCCAGCG TCTACGTCGA ACACCCCGAA CTCATCGCCC AGCGCATCAC CCGCTTCGCC 
GACATCGTCG GCCGCGAGCG CGTCATCCCC GGAACCGACT GCGGCTTCGC GTCCTTCGCC 
ACCTTCCTCG CCGTCGACGA GAGCCTGGCC TGGGCGAAAC TCGAATCCCT CACCGCCGGC 
GCTCGACTGG CCAGCGATCG ACTGTGGTCA TGA

Protein sequence

MKLSSDRILT THTGSLPRPA GLAELIRARE QETLSVADAE YLPERIADAV GVVVGHQAQV 
GLDVISDGEM SKIGYATYVK ERLTGFDVDV AVPEGGGLSI ADLDDYPGMA ERSLAGLETA 
TPTCTGPISY TGTALLDTDL ANFAAGVSSI SAGSGQPTER FMNAASPGVI ALYLPNQFYA 
SLDEYLFALA EGMRAEYEAI TAAGLVLQID APDLAMGRHI QYAHLSEQGF LDRLRVHVEA 
INHALRNIDP ARVRVHLCWG NYQGPHHKDV GLDVILDTII QLKADGLVFE AANHRHAHEW 
QVLADAKIPE QKVLIPGVID TSSVYVEHPE LIAQRITRFA DIVGRERVIP GTDCGFASFA 
TFLAVDESLA WAKLESLTAG ARLASDRLWS