Gene Francci3_3857 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3857
Symbol
ID	3906625
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4621101
End bp	4622402
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	73%
IMG OID	637881183
Product	N-succinyldiaminopimelate aminotransferase
Protein accession	YP_482936
Protein GI	86742536
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID	[TIGR03539] succinyldiaminopimelate transaminase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.947972
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.24112
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CTGAGCGGCC CTGGGAGACC CGGCAACATC TCCGGAGTCC CGCGGTCACC GGCCCGGTCC 
CGGGTGCGAC TGCCCGACTT CCCGTGGGAC CAGCTGGTCT CCTTCAAGGA GAAGGCCCGG 
CTGCATCCCT ATGGGTTGGT CGACCTCTCG GTGGGTACTC CGGTCGACGC CACGCCGGCC 
GTCGTGCAGC AGGCGCTGGC CGGCTCCGCT GACGCTCCGG GGTACCCGCT GACCGCGGGT 
ACCCCGGAGC TGCGCGAGGC GGCGGCCGGC TGGCTGGCCC GCCGGCTCGG CGTGCTCGTC 
GACCCGGGCG CGGTGCTGCC CGTGCTCGGG ACGAAGGAAC TGGTGGCCCA GCTCCCCGGT 
CAGCTCGGGC TCGAACCCGG TGACCGGGTG TGGGTGCCGA CCCCGGCCTA TCCAACCTAC 
GAGGTCGGCG CGCTGCTCGC CCGCTGCGAA CCGGTGGCGG GCCCGGCCGA CGGGGTGACC 
CTGATCTGGT TGAACTCGCC GGGGAACCCG ACCGGGCGGG TGCTCACGGT CGACGAGATG 
CGCGCCGTGG TCACCTGGGC GCGGGAGCGC GGTGTGATCG TCGCCAGCGA CGAGTGCTAC 
ATCGAGCTGG GCTGGGAGAG CCGGCCCGTC TCGGTGCTGC ACCCCGACGT GTGCGGCGGC 
TCCCACGAGG GACTGCTGGC GGTGCATTCG CTGTCGAAGC GGTCCAACCT CGCGGGCTAC 
CGGGCCGGGT TCGTCACCGG TGACCCGGCC CTGGTCGAGG GTCTCCTCGC GGTCCGCAAG 
CACGCCGGCT TCATGATGCC GACGCCCGTG CAGGCCGCCA TGGCGGCTGC GTACGCCGAC 
GACATGCATG TGGCGGATCA GCGGGCGCGC TACGCCAACC GGCGGGCCGT CCTCGCGGCG 
GCGCTCGCGG TCGCGGGTTT CACCATCGAT CACAGCGAGG CCGGCCTCTA CCTGTGGGCA 
ACCCGGGGTG AGGAGGCCTG GGCCACGGTG GACGCGCTGG CCGAGGTCGG GATACTCGTC 
GCGCCCGGGA CGTTTTACGG GGAGGCTGGC CGGTATCACG TCCGGATCGC CCTGACCGCC 
GCGGACTCGC AGGTGGCGAC TGTTCCCGAG CGGATGACGA TGCTGTCGCC GGTCGCCGCC 
ACGGGGCAGC CCGGCCATGG CGCTCGGCCC GGCCATGGCG CTCGGCCCGG CCGTGGCGCT 
CGGCCTGACC ATGGCGCTCG GCCCGGCCAT GGCGCTCGGC CCGACTACGG TCAGCCGGTC 
ACTCAGGGCA GCTATGGGGG TGCCGAGCCG GACATCCGTT AG

Protein sequence

MSGPGRPGNI SGVPRSPARS RVRLPDFPWD QLVSFKEKAR LHPYGLVDLS VGTPVDATPA 
VVQQALAGSA DAPGYPLTAG TPELREAAAG WLARRLGVLV DPGAVLPVLG TKELVAQLPG 
QLGLEPGDRV WVPTPAYPTY EVGALLARCE PVAGPADGVT LIWLNSPGNP TGRVLTVDEM 
RAVVTWARER GVIVASDECY IELGWESRPV SVLHPDVCGG SHEGLLAVHS LSKRSNLAGY 
RAGFVTGDPA LVEGLLAVRK HAGFMMPTPV QAAMAAAYAD DMHVADQRAR YANRRAVLAA 
ALAVAGFTID HSEAGLYLWA TRGEEAWATV DALAEVGILV APGTFYGEAG RYHVRIALTA 
ADSQVATVPE RMTMLSPVAA TGQPGHGARP GHGARPGRGA RPDHGARPGH GARPDYGQPV 
TQGSYGGAEP DIR