Gene Francci3_0097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0097
Symbol
ID	3902930
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	118976
End bp	120046
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	73%
IMG OID	637877427
Product	valine dehydrogenase (NAD)
Protein accession	YP_479220
Protein GI	86738820
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0334] Glutamate dehydrogenase/leucine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.405788
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTCCC TGTTCAGCGC CGTTTGTGAC CATGAGCAGG TGCTGTTGTG CTCGGACCGT 
CCCTCGGGTC TTCACGCGAT CATCGCCATC TACTCGACGG CGCTGGGGCC GTCGCTGGGC 
GGTACCCGCT TCCACCCCTA CGCCGACGAG GAAGTCGCGT TGGCGGACGC CCTCGCCCTG 
TCCCGGGCGA TGGCCTACAA GGCCGCCTGC GCCGGGCTGG ACCTCGGCGG CGGCAAGGCC 
GTCATCATCG GTGATCCGGC CGTCGCGAAG TCGGAGCCAC TGCTGCGCGC CTTCGGCCGC 
CATGTCGCAT CACTGGGCGG CCGATACATC ACCGCTTGCG ACGTCGGTAC CTATGTGGCG 
GACATGGACG TCATCGCCCG GGAAACCCGG TGGGTAACCG GACGGTCACC GGCGCACGGC 
GGTTCGGGCG ACTCCGGCGT GCTGACCGCC TACGGGGTCT TCGAGGGCAT GCGCGCCGCC 
GCCCGGCACC GGTGGGGAAC GCCGAGCCTG GCGGGGCGCC GCGTCGCGGT CTCGGGAGTC 
GGCAAGGTCG GGCGGCGGCT CGTCGGGCAT CTCCTCGACA GCGGCGCCTC GGTGGTCGCG 
GGCGACGTGG ACCCGGTGGC CCTGGCCCGG CTGCGGGTGG AGTTCCCGGC GGCCGAGACC 
GTGCCGGACC CGGACGATCT GCTCGACCTC GACATCGACG TGTACGCCCC CTGCGCGCTG 
GGCGGAGCGC TGAGCGCGGA GACCGTCCGC CGGCTGCGAG CCGGCGTCGT CTGCGGCGGC 
GCCAACAACC AGCTCGCGCA GCCCGAGGTC GGGCGGCAGC TCGCCGACGC CGGAGTCCTG 
TACGCCCCCG ACTTCGTGGT CAACGCCGGC GGCCTGATCC AGGTCGCGGA CGAGATCGAG 
GGCTACTCGC CGGAGCGGGC CCGGGCCAGG GCCGCGCAGA TCTTCGACAC CACCTCGGAG 
GTGTTCCGCC TCGCCGAGGC CGAGGAGGTG ACCCCGACCG AGGCCGCGGA GCGGCTCGCC 
GAACGCCGCA TGACCGACGT GGGACGCCTG CGGGGGATCC TGCTGCCCTG A

Protein sequence

MSSLFSAVCD HEQVLLCSDR PSGLHAIIAI YSTALGPSLG GTRFHPYADE EVALADALAL 
SRAMAYKAAC AGLDLGGGKA VIIGDPAVAK SEPLLRAFGR HVASLGGRYI TACDVGTYVA 
DMDVIARETR WVTGRSPAHG GSGDSGVLTA YGVFEGMRAA ARHRWGTPSL AGRRVAVSGV 
GKVGRRLVGH LLDSGASVVA GDVDPVALAR LRVEFPAAET VPDPDDLLDL DIDVYAPCAL 
GGALSAETVR RLRAGVVCGG ANNQLAQPEV GRQLADAGVL YAPDFVVNAG GLIQVADEIE 
GYSPERARAR AAQIFDTTSE VFRLAEAEEV TPTEAAERLA ERRMTDVGRL RGILLP