Gene Francci3_3855 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3855
Symbol
ID	3905603
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4619021
End bp	4620100
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	74%
IMG OID	637881181
Product	succinyl-diaminopimelate desuccinylase
Protein accession	YP_482934
Protein GI	86742534
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID	[TIGR01900] succinyl-diaminopimelate desuccinylase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.149878
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTCG ACCTCACGGC GCCCGTCGGC GAGCTGACCC GGGCGCTGGT TGACGTGCCC 
TCGGTGAGTG GGGACGAGGC CGCCCTCGCG GGCGCGGTGG AGAAGGCGCT CACCGCGGTG 
GACGGGCTGC GGGTTGACCG GGACGGTGAC GCCGTGGTGG CCAGGACCGA GCTGGGGCTG 
CCCGGCCGGA TCCTGCTTGC CGGCCATCTG GACACCGTTC CGCTGGCGGG CAACCTGCCC 
TCGCGTGTGG TGGGCGGGCG GCTCTACGGC TGCGGGACGT CGGACATGAA GGCAGGGGTC 
GCGGTCGCGC TGCGGCTCGC GGCCACGCTC CCGGTCGCCA CGCCCGGCGC GATGAGCCAC 
GACGTCACCT GGGTCTGCTA TGACCACGAG GAGGTCGAGG CGGCCCGCAA CGGGCTGCGT 
CGGCTCGCCG CCCGGCACCG GGACTGGCTG GATGCGGATC TGGCCATCCT GATGGAACCG 
ACCTCCGGCG AGATCGAGGC GGGTTGCCAG GGCACCCTGC GGGTGGTCGT GACGCTTCCC 
GGCACCCGGG CGCACTCGGC CCGGTCGTGG CTCGGGGACA ACGCCATCCA CAAGGCCGGC 
GATCTGCTCC GCCGCCTCGC CGGCTACCGG GCGCGGACGG TGACGCTGGA CGGCTGCACT 
TACCGTGAGG GGCTCTGCGC GGTGCGGATC GACGGTGGGG TGGCGGGCAA CGTGATCCCC 
GACCGGTGCC AGGTCACGGT GAACTTCCGG TTCGCTCCGG ACCGGGGCCC CGACGAGGCG 
GTGGCGCATG TTCGCGAGGT GCTGGGTGGC TACGACGTCG AGGTCACCGA TCTCGTCGGC 
GGGGCGCTGC CCGGGCTCGC CGCCCCGCAC GCGGCGGCGT TCGTCGCCGC CACCGGTCGT 
GTGCCGGTGG CGAAGTACGG CTGGACGGAC GTGGCGCGCT TCGCCGAGCT CGGGATCCCG 
GCGCTCAACT ACGGGCCGGG CGATCCCAAC CTGGCCCATG CCCGGGACGA GTACGTCGAG 
CTCGCCGCGA TCGACGAGGC CGAGCGGCTG CTACGGGCGT ACCTGTCCGG TGTCTCCTGA

Protein sequence

MSLDLTAPVG ELTRALVDVP SVSGDEAALA GAVEKALTAV DGLRVDRDGD AVVARTELGL 
PGRILLAGHL DTVPLAGNLP SRVVGGRLYG CGTSDMKAGV AVALRLAATL PVATPGAMSH 
DVTWVCYDHE EVEAARNGLR RLAARHRDWL DADLAILMEP TSGEIEAGCQ GTLRVVVTLP 
GTRAHSARSW LGDNAIHKAG DLLRRLAGYR ARTVTLDGCT YREGLCAVRI DGGVAGNVIP 
DRCQVTVNFR FAPDRGPDEA VAHVREVLGG YDVEVTDLVG GALPGLAAPH AAAFVAATGR 
VPVAKYGWTD VARFAELGIP ALNYGPGDPN LAHARDEYVE LAAIDEAERL LRAYLSGVS