Gene Franean1_4922 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4922
Symbol
ID	5673262
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5908905
End bp	5910461
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	77%
IMG OID	641243777
Product	cysteine desulfurase
Protein accession	YP_001509193
Protein GI	158316685
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.00686408
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGTCCCTTT CGTATGCCAC CACGTCTCCC GACGTTGATC GGGAAGGGCC CGCCGTCGGC 
GCGCTGCTCG ACGTGGTGGG GGCCGGCATC CCCGTTCCGC TCGCCGACGG ACGCGAGGTC 
CCGTACGCCA ATCTCGACCA GGCCGCCAGC GCCCCCTGCC TGCGCGGGGT CGCCGAGCAC 
GTCGAGCGCG TCCTGCCGTA CTCGGCGAGC GTGCACCGCG GAACCGGCTA CTCCTCCGCG 
GTCTGCACCG CGCTCTACGA GGGGGCCCGC GCCGCCGTGC GCACGTTCGT CGGCGGCCGC 
CCGGACGACG TCGTGATCTT CACCCGGAAC ACCACCGACT CGGTGAACCT GCTCGCCCGC 
TGCCTCCCGC CGCAGCCGCC CGACCCGCCG CAGCCGCCCG ACCCGGCGCG GACGTCCGAC 
CCGGGCCACG CCGAGCCCGG CGGGGTTGTC GTGTTCGACC TGGAGCATCA CGCGAACCTT 
CTCCCGTGGC GGTCCCGGCC GGGCTGCCGG TGGGTGCCCG CCGCGCCCAC CCGCGCCGAC 
ACGCTGCGCG CGCTCGCCAC CGCCCTGGAC ACGGCACCGA CCTCGCTCGT CGCGGTGACC 
GGCGCGTCCA ACGTCACCGG CGAGGTGCCG CCGCTCGCCG AGATCGTCCG GCTGGCGCGC 
GCGGCCGGCG CGCGGGTCTT CGTGGACGGC GCCCAGCTCG TCCCGCACCG TCGGGTCGAC 
ATGGCCGCGC TCGGCATCGA CTACCTCGCG TTCTCCGGGC ACAAGCTGTA CGCGCCGTTC 
GGCGCCGGCG TGCTCGTCGG ACGTCCGGAC TGGCTGGCGG CGGCCCCGCC CTATCTCGCC 
GGCGGGGGCG CCGTGCGTGA GGTGACCAAC TCCGCCGTGG CCTGGGCGGA CGGCCCGGCC 
CGGCACGAGG CCGGCAGCCC CAACCTCCTC GGCGCGACGG CGATCGCGGC CGCCTGCCGG 
CTGCTGGGCG CGCTCGCCCC CCGCGACCTG CACCAGCACG AGGACCTGCT GCGCCGCCGC 
CTGGTGGACG GGCTGCGCGC GATCGAGGGA GTCACCATCC ACTCCCTGTG GGCCGACGGA 
GACGATCCCG CCGCTGGCGA GGCCGCCGGA GGCGAGGGCC CGGACGGGAT CCTGGCCACG 
GGGCCCGTCG GGGTCGTCAC CTTCTCGGTC GCCGGGCGCG ATCCCGGGTT CGTCGCCGCC 
GTCCTCTCCG CCGAGCACGG CGTCGGGGTA CGCGCCGGAC GCTTCTGCGC GCATCCGCTG 
CTGGGGCGGC TCGGAGCCGA GGGCGGCGCG ATCCGCGCGA GTGTCGGCAT CAGCTCGACG 
AGTGCCGACG TCGACAGGCT GCTGGCAGGG CTGGCGGAGC TCGTCGGCCG CGGGCCGCGC 
CAGCAGTACC GCGACCTGGG CGACGGAGGC TGGGCTCCGG CATCGGACGG TCGCGCGCTG 
CCGCCCTGGG TCGCCGAGCA CATGGCGGCC GGTCACGTCC GCGGTCGTGT GCCCGCGCCG 
GGCCACGCGC ACGACAGCGC CGGCCTGCCC GCGTACTCCA GCCCCTGCGG GACCTGA

Protein sequence

MSLSYATTSP DVDREGPAVG ALLDVVGAGI PVPLADGREV PYANLDQAAS APCLRGVAEH 
VERVLPYSAS VHRGTGYSSA VCTALYEGAR AAVRTFVGGR PDDVVIFTRN TTDSVNLLAR 
CLPPQPPDPP QPPDPARTSD PGHAEPGGVV VFDLEHHANL LPWRSRPGCR WVPAAPTRAD 
TLRALATALD TAPTSLVAVT GASNVTGEVP PLAEIVRLAR AAGARVFVDG AQLVPHRRVD 
MAALGIDYLA FSGHKLYAPF GAGVLVGRPD WLAAAPPYLA GGGAVREVTN SAVAWADGPA 
RHEAGSPNLL GATAIAAACR LLGALAPRDL HQHEDLLRRR LVDGLRAIEG VTIHSLWADG 
DDPAAGEAAG GEGPDGILAT GPVGVVTFSV AGRDPGFVAA VLSAEHGVGV RAGRFCAHPL 
LGRLGAEGGA IRASVGISST SADVDRLLAG LAELVGRGPR QQYRDLGDGG WAPASDGRAL 
PPWVAEHMAA GHVRGRVPAP GHAHDSAGLP AYSSPCGT