Gene Francci3_3930 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3930
Symbol
ID	3906889
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	4704013
End bp	4704867
Gene Length	855 bp
Protein Length	284 aa
Translation table	11
GC content	67%
IMG OID	637881257
Product	nucleotidyl transferase
Protein accession	YP_483009
Protein GI	86742609
COG category	[J] Translation, ribosomal structure and biogenesis [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1208] Nucleoside-diphosphate-sugar pyrophosphorylase involved in lipopolysaccharide biosynthesis/translation initiation factor 2B, gamma/epsilon subunits (eIF-2Bgamma/eIF-2Bepsilon)
TIGRFAM ID	[TIGR02623] glucose-1-phosphate cytidylyltransferase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.24112
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACGG GAGACGCAAC AGCCTTGAGC ATCGAGATCG CCCAGACCAG CGAGATTCCC 
GACGTGGCGG ACATCCCCGT CGTGATCCTG TGCGGCGGGA TGGGAACCCG GCTGCGGGAA 
GCCAGCGAGA AACTACCCAA GCCGCTGGTG GACATCGGCG GCAAGCCGGT GCTGTGGCAC 
ATCATGAAGA CCTACGAGCA CTATGGCTTC CGTAAGTTCG TGCTCTGCCT CGGCTACAAG 
AGCGATCTGA TCAAGAACTA CTTCCTCGCC TACCGTGCGC AGGTCGCCGA CTTCACCCTC 
ACGCTCTCCG ACGACCACAC CCCCCAGTTC CACAACACCG TGGGCGACGA GGCGTGGGAG 
GTGACCTTCG CCGAGACGGG CCTACTCACC GGAACCGGAG CCCGGCTGCG CCGGGTCGCC 
CAGTACCTGA CCGGCCCGCG GTTCATGCTG ACCTACGGCG ACGGCGTGGG TGCCGTCGAT 
GTCGGCGCGG TGCTCGCCGA CCACCTGGCG TCGGGGCGGA TCGGGACGGT CACCGGCGTC 
CGGCCGTCGA GTCGCTACGG CGAGCTGACC ACGGACGGCA ACGCCGTCAC CCTCTTCGCC 
GAGAAGCCGC CGCAGACCGG CTGGGTGAGC GGGGGATACT TCGTCTTCGA GCGCGAGTTC 
ATCGACAAGT ACCTCGACGA CGACCCGGCG CTGCTGCTGG AGCGTCACCC GCTGCAGCAG 
CTGGCCCGGG ACAGCGAGCT GACCCTGCAC ACTCACGACG GGTTCTGGAT GGGTATGGAC 
ACGTTCCGCG ACTGGACCGA GCTGAACCAG CTCTGGGATT CCGGTGCCGC GCCCTGGCGT 
GTCTGGGCCG GCTGA

Protein sequence

MSTGDATALS IEIAQTSEIP DVADIPVVIL CGGMGTRLRE ASEKLPKPLV DIGGKPVLWH 
IMKTYEHYGF RKFVLCLGYK SDLIKNYFLA YRAQVADFTL TLSDDHTPQF HNTVGDEAWE 
VTFAETGLLT GTGARLRRVA QYLTGPRFML TYGDGVGAVD VGAVLADHLA SGRIGTVTGV 
RPSSRYGELT TDGNAVTLFA EKPPQTGWVS GGYFVFEREF IDKYLDDDPA LLLERHPLQQ 
LARDSELTLH THDGFWMGMD TFRDWTELNQ LWDSGAAPWR VWAG