Gene Francci3_0279 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0279
Symbol
ID	3903021
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	323798
End bp	325183
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	71%
IMG OID	637877607
Product	pyridoxal-dependent decarboxylase
Protein accession	YP_479395
Protein GI	86738995
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0076] Glutamate decarboxylase and related PLP-dependent proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCATCGGT TTGACGCGCA GGCTGCCGAC CTCGTCCGCG CGATATGTGA CTTTGCCCGC 
GTCCGGCTCG GATTCGATCC GGTACCGCTG GACGCGCCAT TGTCATGGGA CGAGTTGGCG 
GCGGCGGTGG GATCCACGAT CACCGCCGAG GGCATCGGTG GCCGTCGCGC TCTCGAGGTG 
TTCGACGAGG AGCTGTCCCG CGCCTGTATC TCGACGGATC ATCCCCGCAA TCTCGCCTTC 
ATCCCGGCCG CTCCGACTAA GGCGGCTGTA TTGTTCGATC TGGTGGTCGG GGCGTCGTCC 
ATCTACGCGG GCAGCTGGAT GGAGGGCGCG GGCGCGGTCT TCGCGGAGAA CGAGGCGCTG 
CGATGGCTGT CGGACCTCGC GGGCTTCCCC GCCTGCGCCG GTGGGCTGTT CGTACCGGGG 
GGCACCGTCG GCAACCTGTC GGCGCTGGCC GCCGCCCGGC ATGCCGCCCG GAGCCGGTTG 
ACCGCCGCCG GTCGGCCGAC TCCACCGCGA TGGCGGTTCG TCTGTGGGGC CGAAGCGCAC 
TCCTCCCTCT ACCAGGCCGC CACGGTGCTC GACACCGAGG TCGTCGTCGT GCCGACGGAT 
GACGCCGGAC GACTGACCGG TCCGCTGTTG GCCGAGGCGC TGGACCGGCT CGCCGAGCAG 
GACGGCGCCC AGGCCGTCGA CGGCGTGTTC GCGGTGGTGG CGACCGCAGG GACCACCCAG 
TTCGGCACCG TCGATGACAT CCGCGGGGTG GTGGACGTCT GTCAGGCCCG CGGGCTGTGG 
GTACATGTGG ACGGCGCCTA CGGGCTGGCC GCGCTCGCCG CCGCATCGAC CCACTCTCTC 
TTCGACGGGA TCGCCGAGAC CGACTCGTTC ATCGTCGATC CGCACAAGTG GCTGTTCGCG 
CCGTTCGATG CCTGCGCGCT GGTGTATCGC GATCCGGCGG TGGCCCGGGC GGCGCACGGC 
CCGCAGCGGG CCGGCTACCT CGAGGTCCTG GATTCGGCGG GGGCCTGGAA CCCGTCGGAC 
TACGCCATCG GGCTGTCCCG GCGGGCCCGC GGGCTGCCGT TCTGGTTCTC GCTGGCGACG 
CATGGCACCT TGGCCTACGG CCGGGCCATC GAGTCCACGC TGGCGACCGC CCGGGCGGCC 
GCGCTCCAGA TCGCCGCGCT GCCTTACGTC GAGCTGGTGC GGGAACCGCA GCTGTCGATC 
GTGGTGTTCC GTCGGCTGGG TTGGCAGGCC GCGGACTACC AGCGGTGGAG CGAGAACCTG 
CTGCGGGACG GTTTCGCGTT TGTTCCGCCC ACCGTGCACG AGGGCGAGAC CGTCGCCCGG 
TTCGCCATCG TCAACCCGCG GACCACCGTT GACGACATCG GCGCGATCCT CGCCACGATG 
GCCTGA

Protein sequence

MHRFDAQAAD LVRAICDFAR VRLGFDPVPL DAPLSWDELA AAVGSTITAE GIGGRRALEV 
FDEELSRACI STDHPRNLAF IPAAPTKAAV LFDLVVGASS IYAGSWMEGA GAVFAENEAL 
RWLSDLAGFP ACAGGLFVPG GTVGNLSALA AARHAARSRL TAAGRPTPPR WRFVCGAEAH 
SSLYQAATVL DTEVVVVPTD DAGRLTGPLL AEALDRLAEQ DGAQAVDGVF AVVATAGTTQ 
FGTVDDIRGV VDVCQARGLW VHVDGAYGLA ALAAASTHSL FDGIAETDSF IVDPHKWLFA 
PFDACALVYR DPAVARAAHG PQRAGYLEVL DSAGAWNPSD YAIGLSRRAR GLPFWFSLAT 
HGTLAYGRAI ESTLATARAA ALQIAALPYV ELVREPQLSI VVFRRLGWQA ADYQRWSENL 
LRDGFAFVPP TVHEGETVAR FAIVNPRTTV DDIGAILATM A