Gene Francci3_3778 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3778
Symbol
ID	3906062
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4527275
End bp	4528648
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	70%
IMG OID	637881104
Product	glutamate-1-semialdehyde 2,1-aminomutase
Protein accession	YP_482858
Protein GI	86742458
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0001] Glutamate-1-semialdehyde aminotransferase
TIGRFAM ID	[TIGR00713] glutamate-1-semialdehyde-2,1-aminomutase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0184634
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCCGGG TCGTTGCGCG GGCCAGGGTC GCGGAGCTGG CCGCGCGCGA GTCCGCCCGC 
CTCGACGTCC GCACCCGGGG CTCGGAGGCG CTGCATGCGC GGGCGGTGCG GTCGATGACC 
TCCGGGGTGC CGTCGTCCTA CCAGGTGCGT GATCCCTGGC CGATCTACCT CACCCGCGGT 
CTCGGGTCGA AGGTCTGGGA CGTCGACGGC AACGAGTACT CCGACTTCCA CAACGGGTTC 
GGTTCGATGG TGCAGGGGCA CGCCCACCCG GCGATCGTGC GGGCCGTGAC CGAGCGGGTG 
GCGCTCGGTA CGCACTTCGC GATGCCCACC GAGGACTGCG TGGTGGTCAG CGAGGAGTTG 
GCCCGCCGCT TCGGCCTGCC GCAGTGGCGC TATGTCAACT CCGGCTCCGA GGCGACGATG 
GACGCGATCC GCATCGCCCG CGGCGTCACC GGCCGCGACA CGATCGTCAA GATCTTCGGT 
TCGTACCACG GGCACCACGA CTACGTGATG GTGTCGATCG GGACCCCGTA CGACGACATC 
GGTCCGGCCG AGAACATGAA CTCGTTGGGT TACGGTGCCG GGATCCCCCG GGTGGTCGTC 
GACCTCACGG TGCCGGTCCC CTTCAACGAC GCTCCGGCGA TGGAGCGGCG GATCGCCGCG 
CTCGCCGCCG AGGGACGCCT GCCCGCCTGT GTGATCATGG AGCCGGCGAT GATGAACCTC 
GGCGTCGTCC TGCCGGAGCC CGGTTACCTG GCGGCGGTCC GGGAGATCAC CTCCCGGTAC 
GGGGTTATCC TGATCTTCGA CGAGGTCAAG ACGGGGCTGT GCGTGGCGGC CGGTGGGGCC 
ACCGAGAGGT TCGGCGTGCG CCCGGACCTG GTGACCCTGG CCAAGGCGCT CGGTGGCGGG 
CTGCCGTCCG GGGCGATCGG CGCGACGGCG GAACTGATGG AGGCCGTGGC CTCGGACCGG 
GTGAAACAGG TCGGCACGTA CAACGGCAAC CCGCTGACCA TGGCCGCCGC CCGGGCGAGC 
CTGTTCGAGG TGCTCACTCC CGACGCCTAC ACCCACCTCG ATCGGCTGGG TGGCCGGTTG 
ACCGCCGGCT GCGACGAGAT CCTGACCCGG CACGGCATTC CCGGCTACAC CGTCGGCATC 
AGCTCGAAGG GATGCGTGCA CTTCACCGAC GCCCCGATCC GTGACTACAC CTCGTTCATG 
GCGCACCAGA ACGCCGAGTT GCCCGAACTG GCCTGGCTCT ACAACGCCAA CCGCAACGTC 
CTCATGGCGC CCGGGCGCGA GGAGGAGTGG ACGTTGTCGG TGCAGCACAC CGACGCCGAT 
GTCGACCGCT ACCTCGACAG CCTCGACCAG ATGGCCCGGG ACCTCGTCGG CTGA

Protein sequence

MTRVVARARV AELAARESAR LDVRTRGSEA LHARAVRSMT SGVPSSYQVR DPWPIYLTRG 
LGSKVWDVDG NEYSDFHNGF GSMVQGHAHP AIVRAVTERV ALGTHFAMPT EDCVVVSEEL 
ARRFGLPQWR YVNSGSEATM DAIRIARGVT GRDTIVKIFG SYHGHHDYVM VSIGTPYDDI 
GPAENMNSLG YGAGIPRVVV DLTVPVPFND APAMERRIAA LAAEGRLPAC VIMEPAMMNL 
GVVLPEPGYL AAVREITSRY GVILIFDEVK TGLCVAAGGA TERFGVRPDL VTLAKALGGG 
LPSGAIGATA ELMEAVASDR VKQVGTYNGN PLTMAAARAS LFEVLTPDAY THLDRLGGRL 
TAGCDEILTR HGIPGYTVGI SSKGCVHFTD APIRDYTSFM AHQNAELPEL AWLYNANRNV 
LMAPGREEEW TLSVQHTDAD VDRYLDSLDQ MARDLVG