Gene Francci3_0434 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0434
Symbol
ID	3903623
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	516423
End bp	517493
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	71%
IMG OID	637877766
Product	3-dehydroquinate synthase
Protein accession	YP_479550
Protein GI	86739150
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCACAG CACAGCGGAC GAGTCCGATC GAGCAGATCA CCGCCGATCA TCGACGGGTC 
TCGGTGGACC TCGGCTCACG CAGCTATCCG ATCGATATCG GTCCCGGGGT CCGCCGAATC 
CTGCCCGACA TCGTCGCGCG GATCGGCGCC CGGCGGGCCG TCATCGTCTC GGCGCGGCCG 
CAGGACGCGG TTCCCGACCC GGGCGTGCCG GTACTGCGGC TGGCCGCACG GGACGGCGAG 
GCGGACAAGA ACCTGTCGAA CGTCGAGGCG CTCTGCGGCC GGTTCGCGGC TTTCGGGCTG 
ACCCGGTCGG ACGTCGTCAT CTCCTGCGGC GGGGGAACCA CCACGGACGT CGTCGGGCTC 
GCCGCGGCAT TGTACCACCG CGGCGTGGCG GTGGTACACC TCCCGACATC CCTGCTCGCC 
CAGGTGGACG CGAGCGTCGG CGGGAAGACG GCGGTGAACC TGCCCGCCGG CAAGAACCTC 
CTCGGTGCCT ACTGGCAACC CAGCGCCGTC CTCTGCGACA CCGACCACCT GCGGACCCTG 
CCCCGGCGGG AGTGGATCAA CGGCTACGGC GAGATCGCGC GGGCCCACTT CATCGGCACC 
GGGGACCTGC GCGGTCTGCC GGTGACGGAG CAGATCACCG CCAGCGTGGC GCTCAAGGCC 
GCCGTCGTCG CTCGGGACGA ACGGGACTCA AGCCTGCGCC ACATCCTCAA CTACGGCCAC 
ACCCTGGGGC ATGCCCTGGA GCGCGTCACC GACTTCGTGC TGCGCCACGG TGAGGCGGTG 
GCGATCGGCA CCGTGTTCGC CGGCCGTCTC GCCGGGGAGC TCGGCCGGAT CGGGGACGAT 
CGGGTCCGCG AGCACCTGGA CGTGGTCCGC GGCTACGGGC TGCCGACGGC CCTGCCCACC 
GAGGCGGACG CCGCCGAACT CGTCGCCGTG ATGCGTCTGG ACAAGAAGTC GACGAACACC 
GGCCTCACCT TCGTGCTCGA CGGTGCGGAC GGCCCACAGC TGGTGGGCGA CATTCCGGAG 
GACCTGGTCA TGAAGACGCT CGGCGACATG CCGCGCGGGC CGCTGGCCTG A

Protein sequence

MLTAQRTSPI EQITADHRRV SVDLGSRSYP IDIGPGVRRI LPDIVARIGA RRAVIVSARP 
QDAVPDPGVP VLRLAARDGE ADKNLSNVEA LCGRFAAFGL TRSDVVISCG GGTTTDVVGL 
AAALYHRGVA VVHLPTSLLA QVDASVGGKT AVNLPAGKNL LGAYWQPSAV LCDTDHLRTL 
PRREWINGYG EIARAHFIGT GDLRGLPVTE QITASVALKA AVVARDERDS SLRHILNYGH 
TLGHALERVT DFVLRHGEAV AIGTVFAGRL AGELGRIGDD RVREHLDVVR GYGLPTALPT 
EADAAELVAV MRLDKKSTNT GLTFVLDGAD GPQLVGDIPE DLVMKTLGDM PRGPLA