Gene Francci3_1998 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1998
Symbol
ID	3903706
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2348170
End bp	2349399
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	70%
IMG OID	637879334
Product	O-succinylhomoserine sulfhydrylase
Protein accession	YP_481101
Protein GI	86740701
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR01325] O-succinylhomoserine sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.469724
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCCTC CGTCCTCCAA CCGTACGGCC TCCGGCACCC GCCGCGGACT GGCGACGGAG 
GCGGTGCGTG CCGGCCATCG CCAGTCCGTT GACGACCAGC ACAGCGAGGC GCTGGTACTC 
ACGTCGAGCT ACCTGTTCGA CGACTCGCAC GACGCGGCGG AGAAGTTCGC GCAGCGGCGC 
CCCGGCAACG TCTACGTCCG GTTCACGAAC CCGACGGTGC GCGCGTTCGA GGAGCGCGTC 
GCGCGGCTGG AGGGTGCCGA GTCCGCCGTA GCGACCGCGT CCGGGATGGC CGCATTCTTG 
GCGGTGTCGC TCGGGCTGCT GCGCGGCGGG GACCATGTCC TGCTTGCGGA GGGTGTCTTC 
GGCACCACGA CCCGGCTCTA TGCTCACTAT CTGGACCGGT TCGGCGTCAT GACGACCGTC 
GTTCCGGTGA CCGACCCGGC CGCCTGGGCG CGCGCAATGC GTGCGCAGAC CAGGATGCTC 
GTCGTTGAGA GCCCCACGAA CCCGGTAATG GCCGTGGCCG ACATCAGGTA CCTCGCAGAG 
CTCGCACATG CCGCCGGCGC GCTGCTGCTG GTCGACAACA CCCTGTGCAC CCCGGTGTTC 
CAGCAACCGA TCGTGTTTGG CGCAGACCTC GTTCTGCACT CCGCCGGCAA GTACATCGAC 
GGTCAGGGCC GCTGCGGCGG CGGCGTTGTC GCCGGCCGCG CGGGCCTGAT CTCCGAGCTG 
CACGGTGTGC TGCGCACCGC GGGCCCGAGC CTCAGCCCGT TCAACGCGTG GATCTTCCTG 
AAGAGCCTGG AGACGCTGCC GGTGCGGATG CGGGCGCACG ACGCCAACAC GGCGGTGGTG 
GCTGCCTGGC TAGCCGACCA ACCGGACGTA CGGGCGGTGC ACTACACCGG CAGCGCGGAT 
CACCCGCAGC GGGAGCTGGT AGCCGCCCAA CAGTCCGGGC ACGGCGGAGT GATCAGCTTC 
GAGCTGTACG GCGGCCAGCA GGCCAGCTGG TCGTTTGTCG ACCGGCTTGA GCTCGTGTCG 
AACACGACAA ACATCGGGGA CACCAAGTCG ATGATCACCC ATCCGGCAAG CACCACCCAC 
GGCCGGCTCA CGCCGGCACA GCGCGACTCC GCCGGCGTCA CCGACGGCCT GCTGCGCCTA 
TCGGTCGGCC TGGAGGACGT CGAGGACATC GTCGCCGATC TGGCCCGGGC GTTCGCAGCG 
ACCAGGCCTG CCGGGGCCCG CGCCCGATGA

Protein sequence

MTPPSSNRTA SGTRRGLATE AVRAGHRQSV DDQHSEALVL TSSYLFDDSH DAAEKFAQRR 
PGNVYVRFTN PTVRAFEERV ARLEGAESAV ATASGMAAFL AVSLGLLRGG DHVLLAEGVF 
GTTTRLYAHY LDRFGVMTTV VPVTDPAAWA RAMRAQTRML VVESPTNPVM AVADIRYLAE 
LAHAAGALLL VDNTLCTPVF QQPIVFGADL VLHSAGKYID GQGRCGGGVV AGRAGLISEL 
HGVLRTAGPS LSPFNAWIFL KSLETLPVRM RAHDANTAVV AAWLADQPDV RAVHYTGSAD 
HPQRELVAAQ QSGHGGVISF ELYGGQQASW SFVDRLELVS NTTNIGDTKS MITHPASTTH 
GRLTPAQRDS AGVTDGLLRL SVGLEDVEDI VADLARAFAA TRPAGARAR