Gene Franean1_6424 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6424
Symbol
ID	5674739
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	7803706
End bp	7805097
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	73%
IMG OID	641245272
Product	cystathionine beta-synthase
Protein accession	YP_001510667
Protein GI	158318159
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0031] Cysteine synthase
TIGRFAM ID	[TIGR01137] cystathionine beta-synthase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.510477
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.13322
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGTGT ACGACCACGT CACCGACCTG GTCGGTGACA CGCCACTGGT GCGGCTGACG 
CCGGTGATCG CCGACACGGT GACACCCGTG CTCGGCAAGC TCGAGTACCT CAACCCGGGC 
GGCTCGGTGA AGGACCGCAT CGCCCTGTCG ATGGTGGCGG CGGCTGAGCG CGACGGCCGG 
CTCACCCCCG GCGGGACCAT CGTCGAGCCC ACCAGCGGGA ACACCGGTGT GGGCCTGGCC 
ATGGTCGCCG CGCGACGCGG CTATCGCTGT GTCTTCACCA TGCCGGACAA GATCAGCGAG 
GAGAAGCGGG CCGTCCTGCG GGCCTACGGG TCCGAGGTGA TCGTCTGCCC GACGGCCGTC 
GCGCCGGACG ACCCCCGCTC CTACTACTCG GTCGCCCGCC GGGTGCTGAG CGAGACCCCC 
GGCGCCTGGA GCCCCGACCA GTACTCCAAC CCTGACAACC CGGCCGCGCA CGAGGCCTCC 
ACCGGCCCGG AGATCTGGCG GGCCACCGAC GGCCGGGTGA CGCACTTCGT CGCCGGCATC 
GGCACCGGCG GGACGATCAG CGGGACGGGC CGCCATCTCA AGGCGGTCAG CGGCGGCACC 
GTGCAGGTGA TCGGCGCCGA TCCCGAGGGC TCGGTCTACT CCGGCGGCAG CGGCCGGCCC 
TACCTGGTCG AAGGCGTCGG CGAGGACATC TGGCCGACGA CCTACGACAA GTCCGTGGTC 
GACCGGGTGG AGGCCGTCAG CGACCGCGAC TCGTTCCTGA TGACGCGCGA GCTGGCCCGC 
CGGGCCGGGA TCCTCGTCGG TGGCTCCTGC GGCCTGGCGG TCGTCGCCGC GCTGCGGGTC 
GCCCGCGAGC TCGACGCGGC CGGGACGACC GACGCCTGCG TCGTGGTGCT GCTCCCCGAC 
TCCGGCCGCG GCTACCTGTC GAAGATCTTC AACGACGAGT GGATGTACGA CAACGGGTTC 
CTCGACCCGC CGTCCGACGA GCCGACGGTC GCCTCGGTGC TCGCGCACAA GGCCGCGCAG 
ACGTCCGGGC CGCCGAACCT CGTCCACGTG CATCCCGACG AGACCGTCGG GGCGGCCATC 
TCGTACCTGC GGGAGTATGG GGTCTCGCAG ATGCCGGTGG TGCGCCACGA GCCGCCGGTG 
CGGGCCGCGG AGGTGGCGGG CGCCGTGCTG GAGCGCGAGC TGCTCGACGC AGTCTTCGCC 
GACCGGGGGA CGGTGGACGC GCCCGTCGCC GACCACATGT CGCCACCGCT GCCGACGGTC 
GGCGCCGGCG AGCCCGTCTC GGTGCTGGTG AGCGCGCTCG GCGAGAACCC GGCCGCCCTC 
GTCCTGGACG AGGGGAACCC GACGGGGATC CTCACCCGGG CCGACCTGCT GGGGTTCCTC 
GCCGTCCGCT GA

Protein sequence

MDVYDHVTDL VGDTPLVRLT PVIADTVTPV LGKLEYLNPG GSVKDRIALS MVAAAERDGR 
LTPGGTIVEP TSGNTGVGLA MVAARRGYRC VFTMPDKISE EKRAVLRAYG SEVIVCPTAV 
APDDPRSYYS VARRVLSETP GAWSPDQYSN PDNPAAHEAS TGPEIWRATD GRVTHFVAGI 
GTGGTISGTG RHLKAVSGGT VQVIGADPEG SVYSGGSGRP YLVEGVGEDI WPTTYDKSVV 
DRVEAVSDRD SFLMTRELAR RAGILVGGSC GLAVVAALRV ARELDAAGTT DACVVVLLPD 
SGRGYLSKIF NDEWMYDNGF LDPPSDEPTV ASVLAHKAAQ TSGPPNLVHV HPDETVGAAI 
SYLREYGVSQ MPVVRHEPPV RAAEVAGAVL ERELLDAVFA DRGTVDAPVA DHMSPPLPTV 
GAGEPVSVLV SALGENPAAL VLDEGNPTGI LTRADLLGFL AVR