Gene Franean1_1102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1102
Symbol
ID	5669516
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1315629
End bp	1317302
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	72%
IMG OID	641240034
Product	putative alpha-isopropylmalate/homocitrate synthase family transferase
Protein accession	YP_001505464
Protein GI	158312956
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR00977] 2-isopropylmalate synthase/homocitrate synthase family protein

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.828904
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTTCACG ACACCCCAGC TCCGCTCGGT TCAGCTCCGC TCGGCTCCGC TCACCTCGGT 
GCCGCCGGCG GGCTCCCGTT CGACCGGGAG TCGCTGCACA TCTACGACAC CACGCTGCGC 
GACGGCACCC AGCAGGAAGG CCTGTCGCTG TCGGTCGCCG ACAAGCTGGC GGTCGCCCGG 
CACCTCGACG ACCTGGGTGT CGGCTTCATC GAGGGCGGCT GGCCCGGCTC GAACCCCAAG 
GACGCCGAGT TCTTCCGGCG GGCCCGCACC GAGCTCGACC TCAACGGCGC GCTGCTGACC 
GCGTTCGGGT CGACCCGGCG GGCCAGCAAG GCCGTCGCCG ACGACTCCCA GGTCGCCGCG 
CTGCGCGACG CCGGCACCTC CGTGGTCTGC CTGGTGGCCA AGGCCGACCG CCGGCACGTC 
GAGCGCGCGC TGCGGACCAC GCCCGCCGAG AACCTCGCGA TGATCCGCGA CACCGTCCGT 
CACCTGACGA ACGAGGGCAA GCGGGTCTTC GTCGACGCCG AACACTTCTT CGACGGCCAC 
CGCGCCGACC CCGCCTACGC GCTCGAGATG GTGCGCACCG CGGCCGAGGC CGGTGCCGAG 
GTGATCGTGC TGTGCGACAC CAACGGCGGC ATGCTGCCCA CCCGGATCGG TGACGTCGTG 
GCGGCCACGC TCGCGAGCAC CGGAGCGCGC CTGGGTATCC ACACCCACGA CGATGCCGCC 
TGCGCCGTCG CGAACAGCCT GGTGGCGATC GAGGCCGGGG CCACCCACGT CCAGGGGACC 
GCCAACGGCT ACGGCGAGCG TTGCGGGAAC GCCAACCTGT TCAGCGTCGT CGCGGGCCTG 
GAGACCAAGC TGGGCCGCCA GGTCCTGCCG GCCGGGCGGC TGCGTGAGCT CGTGCGTGTC 
TCACACGCCA TCGACGAGGT CACCAACTCG GCCCCGAGCA CGCACCGGCC CTACGTCGGC 
GCCAGCGCCT TCGCGCACAA GGCCGGCCTG CACGCGAGCG CCGTCAAGGT CGACCCCGAC 
ATGTATCAGC ACATCGACCC GGCCGCCGTC GGCAACGACA TGCGGATGCT CGTCTCCGAA 
CTGGCCGGCC GCGCGACCCT CGAGCTCAAG GGCCGCGAGC TCGGCATGGA CCTCTCCGGG 
GAGCGTGAGG CGCTCGGTCG GGTGCTGGAG ATGGTCAAGG ACAGGGAGGC CTCCGGCTAC 
GCCTACGAGG CCGCCGAGGC GTCCTTCGAG CTCATGCTGC TGGACGAGGT CTCGGGCCGG 
GAGCGGTTCT TCACCCTGGA ATCCTGGCGG GTCATCGTCG AGCAGCGCTC CGGCGGCGAG 
GTCGTCAGCG AGGCCACGGT GAAGCTCACC TCCCACGGCG AGCGGCACGT GTCGACGGCG 
GAGGGCAACG GGCCCGTCAA CGCGCTCGAC ACCGCCCTGC GCAAGGCGCT GGAGAAGGCC 
TACCCGGGCC TGGCCGATCT CGACCTGGTC GACTACAAGG TCCGCATCCT CGACGGCCGG 
CAGGGCACCG GTGCGGTCAC CCGCGTCCTG GTGGAGACCA GCGACGGCCG CGGCCGCTGG 
GACACCATCG GCGTCGACGA GAACATCATC GCCGCCTCCT GGGTGGCGCT GCAGGACGCC 
GTCACCTACG GCCTACGCCG CCAGGGTGAG CGCCCCGACC CGGACGCCGT CTGA

Protein sequence

MVHDTPAPLG SAPLGSAHLG AAGGLPFDRE SLHIYDTTLR DGTQQEGLSL SVADKLAVAR 
HLDDLGVGFI EGGWPGSNPK DAEFFRRART ELDLNGALLT AFGSTRRASK AVADDSQVAA 
LRDAGTSVVC LVAKADRRHV ERALRTTPAE NLAMIRDTVR HLTNEGKRVF VDAEHFFDGH 
RADPAYALEM VRTAAEAGAE VIVLCDTNGG MLPTRIGDVV AATLASTGAR LGIHTHDDAA 
CAVANSLVAI EAGATHVQGT ANGYGERCGN ANLFSVVAGL ETKLGRQVLP AGRLRELVRV 
SHAIDEVTNS APSTHRPYVG ASAFAHKAGL HASAVKVDPD MYQHIDPAAV GNDMRMLVSE 
LAGRATLELK GRELGMDLSG EREALGRVLE MVKDREASGY AYEAAEASFE LMLLDEVSGR 
ERFFTLESWR VIVEQRSGGE VVSEATVKLT SHGERHVSTA EGNGPVNALD TALRKALEKA 
YPGLADLDLV DYKVRILDGR QGTGAVTRVL VETSDGRGRW DTIGVDENII AASWVALQDA 
VTYGLRRQGE RPDPDAV