Gene Franean1_1744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1744
Symbol
ID	5670146
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	2083956
End bp	2085491
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	75%
IMG OID	641240662
Product	argininosuccinate lyase
Protein accession	YP_001506088
Protein GI	158313580
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0165] Argininosuccinate lyase
TIGRFAM ID	[TIGR00838] argininosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.00814038
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGATCCCG AACGGGCACA GGGCGACGTC GCGCGCACGG ACGCGGCGCG CACGGACACC 
GCCGACGACA CCGACGGAGA GGACACCGGG GGGCACGCCG GCGCGGGTGG GCAGGCGGAC 
GCCCCCGCGT CGACGCCGCC GCTGCGGCTG TGGGGCGGGC GGTTCGCGGG CGGGCCGGCC 
GAGGCGCTGG CGCGGCTGTC GGTCAGCGTG CAGTTCGACT GGCGCCTGGC GCCGTACGAC 
CTGCTCGCCT CCCGCTCACA CGCCCGCGTC CTGCACCGCG CCGGCCTGCT GGACGACGCC 
GAGCTGACGG CGATGCTCGG CGCACTCGAC GACCTGTCGG ACGCGGTCGC CCACGGCCGC 
TTCCGCCCGA CCATCGAGGA CGAGGACGTC CACACCGCGC TCGAGCGGGG GCTGCTCGAG 
CGCCTCGGCG CGCTCGGGGG CAAGCTCCGG GCCGGCCGGA GCCGCAACGA CCAGGTCGCG 
ACCGACCTGC GCCTGTACCT GCGCGATCAC GCGCGTCAGG TCGCCGCGCG GGTCACCGAG 
CTCTCCACCG CCCTCGTCGG GCTGGCCGAG CAGCACGTCG AGACCCCGGC ACCGGGGATG 
ACCCACCTGC AGCACGCCCA GCCGATCTCG TTCGGGCACC AGCTGCTGGC GCACGTCCAC 
GCGTTCGCCC GGGACACCGA CCGGCTGCGG GACTGGGACC GGCGTGCCTC GGTGAGCGCG 
CTCGGCGCCG GCGCGCTCGC CGGCTCCTCA CTGCCGCTGG ACCCGGCGGG GGTGGCCGCC 
GAGCTCGGCT TCGACCGGGC CTTCGCCAAC TCGCTCGACG CGGTGTCCGA CCGGGACTTC 
GCCGCCGAGT TCCTCTTCAT CGCCGCGCTG ATCGGGGTGC ACCTGTCCCG GCTCGGTGAG 
GAGATCGTCC TGTGGACGAC CCGGGAGTTC GGCTGGGTCG AGCTTGACGA CGCCTTCGCC 
ACCGGCAGCT CGATCATGCC GCAGAAGAAG AATCCGGACG TGGCCGAGCT GGCCCGCGGC 
AAGTCGGGCC GGCTCATCGG CGCGCTCACC GGGCTGCTGA CCACCCTCAA GGGCCTGCCG 
CTCGCCTACG ACCGCGACCT GCAGGAGGAC AAGGAGCCGG TGTTCGACGC GGTCGACACC 
CTCCTCGTTG TGCTGCCGGC GGTGACCGGC ATGGTCGCGA CGATGCGGGT GCGCCGGGAA 
CGGCTCGCGG CCGCCGCGCC GGACGGGTTC GCGCTGGCGA CGGACGTGGC GGAGTACCTC 
GTCCGCAACG GGGTCGCCTT CCGGGAGGCA CACGAGGCCG TCGGGCAGCT CGTGGCCTGG 
TGTGTGGCCC ACGACGCCGA CATGGACGAG GTCTCCGAGG ACGATCTCGC GGTCATCAGC 
CCACTGCTCA CCGCCGACGT CCGATCGGTG CTCTCGGTGC GTGGTGCGCT CGAGGCACGC 
TCGGCACCGG GCGGGACGGC TCCCGCGCGC GTCCGGGAGC AGATCGAGGC GCTCGGGCCG 
GTGCTCGACC GGGACCGGGC GTGGGCCGGG AGCTGA

Protein sequence

MDPERAQGDV ARTDAARTDT ADDTDGEDTG GHAGAGGQAD APASTPPLRL WGGRFAGGPA 
EALARLSVSV QFDWRLAPYD LLASRSHARV LHRAGLLDDA ELTAMLGALD DLSDAVAHGR 
FRPTIEDEDV HTALERGLLE RLGALGGKLR AGRSRNDQVA TDLRLYLRDH ARQVAARVTE 
LSTALVGLAE QHVETPAPGM THLQHAQPIS FGHQLLAHVH AFARDTDRLR DWDRRASVSA 
LGAGALAGSS LPLDPAGVAA ELGFDRAFAN SLDAVSDRDF AAEFLFIAAL IGVHLSRLGE 
EIVLWTTREF GWVELDDAFA TGSSIMPQKK NPDVAELARG KSGRLIGALT GLLTTLKGLP 
LAYDRDLQED KEPVFDAVDT LLVVLPAVTG MVATMRVRRE RLAAAAPDGF ALATDVAEYL 
VRNGVAFREA HEAVGQLVAW CVAHDADMDE VSEDDLAVIS PLLTADVRSV LSVRGALEAR 
SAPGGTAPAR VREQIEALGP VLDRDRAWAG S