Gene Franean1_1238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1238
Symbol
ID	5669651
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	1485521
End bp	1487227
Gene Length	1707 bp
Protein Length	568 aa
Translation table	11
GC content	75%
IMG OID	641240170
Product	AMP-dependent synthetase and ligase
Protein accession	YP_001505598
Protein GI	158313090
COG category	[I] Lipid transport and metabolism
COG ID	[COG0365] Acyl-coenzyme A synthetases/AMP-(fatty) acid ligases
TIGRFAM ID	[TIGR01217] acetoacetyl-CoA synthase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00280007
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGCCGCAG ACGAAGGACC GAAACACGAC GAACCACGCG ATGGGCGGGA CGGCGGTGCG 
GGCCCGAGCG GACCGGGTGG CCCCCCGCGT CGGGTCGGCG AGGGCACCGT GCTGTGGGAG 
CCCCCGCCGC GACGGGTTGC CGAGGCCTCG GTGACGAGGT ACCGGGAGTG GCTGGCGGAC 
GAACACCAGC TGCGCATCGC CGACTCCACC CGGCTACGGC TGTGGGCCGA GGCCGAACCC 
GGCCGGTTCT GGGACTCGAT CTGGGAGTTC TGCGCCGTCG AGGGTGACCG TGGCGACGGG 
CCGGCGCTGA CCGGCGCGGC CGTGCCCGAC GCCCGCTGGT TCCCGACGGC CCGGGTCAAC 
TACGCGGAGA ACGCGCTCAC CCGGCGCGGC CCGGCCCCGG CGATCATCGC TGTCCGGGAG 
GACGGCGCGA CCGCGGTGGT GAGCTGGGAC GAGCTGCGCA GGCAGGTGGC ACGGGCCGCC 
GCCGGGCTGC GCCGGCTCGG GGTCAGGCCC GGCGACCGGG TCGGAGCGGT GCTGCCGAAC 
ACGGTGCACG CGGTGGTGGC GATGCTGGCG ACGGCGAGCG TCGGGGCGGT GTGGGCGTCG 
TGCTCACCGG ATCTCGAACC GGCCGCGCTC GCCGAGCGGT TCATCCAGAT CACCCCGCGG 
GTGCTCATCG GCGTCGACGG GTACACCCGC GGCGGCCAGG GCTACGACGC GATCCCGCCG 
CTGGCCGACC TGGCCCGGCG CCTACCCAAC CTGGCTGCCA CGGTGCTGGT GCCCTACCTG 
TCCGCCGACG CCTACCCGCG GGCGGCGAGC GCAGACCTGC CGGGCCTGCT CACCTGGGAC 
GACCTGCTCG CCGCCGAGGC GGAGCCGGCC TTCACCCGGC TGCCGTTCGA CGCGCCGCTG 
TGGATCCTGT TCGCCGACGA GATCGCCGGC CCGCCCAGGC CGGTCGTCCA CGGGCACGGC 
GGGATCCTGC TGGAACACCT GAAGTCGCTG GTGCTGCACC TCGACCTCGG CCCGGACGAC 
CGCTTCTGCT GGTACGGCAC GACCAGCGGC ATGATGTGGA ACTACCAGGT CTCCGGGCTG 
CTCACCGGCG CGACGATCGT GCTCTACGAC GGCAGCCCTA GCCACCCGGA CGTGTCCATC 
CTGTGGCGGC TCGCCGAGGC GGTGGACGTC ACCTGCCTGG GCGTCTCCGT GGCCCTCGTC 
GAGGCCTGCC GGCGGGTCGG GCTGGTGCCA GGCCGCGTCG CGGATCTCTC GCTGTTGCGC 
ACGGTCGGGG CGTTCGGGGC CCCGTTCGTC CCCGAGGCCG GTGCCTGGGT CTACGACACG 
GTGAGCCCGT CGGTGGCCTT CGTCGCCATG AGCGGCGGCA CGGAGGTCTG CACCGCGCTG 
GTCACAGGGC TGCCGACCGA CCCGGTGCGG GCCGGCGAGG CGGGCCGTGC GCTGGGGTGC 
GCGGTGGCCG TCGTGGACCC GTCCGGCCGG GAGGTGCCCG GTGGCGGTGC CGGGGAGCTG 
GTCGTCACCG CGCCGATGCC GTCGGCGCCC CTGTTCGTGT GGGGCGACCC GACCGGCTCG 
TGGCTGCTCC AGAAGCACCT GGCGAGGTTT CCGGGCTGGT GGTGGCAGGG CGAGCGCGCG 
CGGATGACGC AGGCCGGCGG GATCGCCGTC GACGGTCCGC TGGACGCCCT CGCCGCGCCC 
ACCGGCGCAC GCACCGCCGG CGCATAG

Protein sequence

MAADEGPKHD EPRDGRDGGA GPSGPGGPPR RVGEGTVLWE PPPRRVAEAS VTRYREWLAD 
EHQLRIADST RLRLWAEAEP GRFWDSIWEF CAVEGDRGDG PALTGAAVPD ARWFPTARVN 
YAENALTRRG PAPAIIAVRE DGATAVVSWD ELRRQVARAA AGLRRLGVRP GDRVGAVLPN 
TVHAVVAMLA TASVGAVWAS CSPDLEPAAL AERFIQITPR VLIGVDGYTR GGQGYDAIPP 
LADLARRLPN LAATVLVPYL SADAYPRAAS ADLPGLLTWD DLLAAEAEPA FTRLPFDAPL 
WILFADEIAG PPRPVVHGHG GILLEHLKSL VLHLDLGPDD RFCWYGTTSG MMWNYQVSGL 
LTGATIVLYD GSPSHPDVSI LWRLAEAVDV TCLGVSVALV EACRRVGLVP GRVADLSLLR 
TVGAFGAPFV PEAGAWVYDT VSPSVAFVAM SGGTEVCTAL VTGLPTDPVR AGEAGRALGC 
AVAVVDPSGR EVPGGGAGEL VVTAPMPSAP LFVWGDPTGS WLLQKHLARF PGWWWQGERA 
RMTQAGGIAV DGPLDALAAP TGARTAGA