Gene Franean1_1766 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1766
Symbol
ID	5670168
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	2118874
End bp	2120232
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	69%
IMG OID	641240687
Product	glutamine synthetase catalytic region
Protein accession	YP_001506110
Protein GI	158313602
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0174] Glutamine synthetase
TIGRFAM ID	[TIGR00653] glutamine synthetase, type I

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.725397
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.000162709
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGACAAAC AACAGGAATT CGTTCTTCGC ACCCTCGAGG AACGCGACAT CCGGTTCGTC 
CGGCTCTGGT TCACCGACGT CCTGGGGGTG CTGAAGTCGG TCGAGATCGC GCCGGCCGAG 
CTGGAGGGCG CGCTCGCCGA GGGCATCGGC TTCGACGGCT CCGCGATCGA GGGCTTCGCG 
CGGGTGCACG AGGCGGACAT GCTCGCCCGG CCCGACCCGT CCACCTTCCA GGTGCTGCCG 
TGGCGCGGCG AGCACCCGAT GACCGCCCGC ATGTTCTGCG ACCTGGTCAT GCCGGACGGG 
ACGCCCGCGG TCGCGGACTC CCGCTGGGTG CTGCGCCGCA CCCTGGCGAG GGCGGCCGAC 
GCCGGGTTCA CCTTCTACAC CCATCCCGAG ATCGAGTTCT TCCTGCTCAA GCACCCGCCG 
ACGCGCGGCG GCCCGATGCC GCCGCCGGTG GACGAGTCGG GCTACTTCGA CCTGACCCCG 
AACGACATCA GCCACGACTT CCGCCAGCAG GCCATCGGCG TGCTGGAACG GCTCGGTATC 
TCGGTGGAGT TCAGCCATCA CGAGGTCGCC CCGGGCCAGC AGGAGATCGA CCTGCGCTAC 
GCCGACGCGC TCACCATCGC CGACAACATC ATGACCTTCC GGCAGGTGGT GAAGGAGGTG 
GCGCTGCGCC AGGGCATCTA CGCGACGTTC ATGCCCAAGC CGTTCAGCGA CCAGGCCGGG 
TCGGGCATGC ACACCCACAT GAGCCTGTTC GAGGGCGACC GCAACGCCTT CCACGACCCG 
ACCGACGAGT ACCAGCTCTC CAAGGTGGCC AAGGCGTTCA TCGCCGGGCT GCTGGTGCAC 
TCCGCTGAGA TCACCGCGGT CACCAACCAG TGGGTGAACT CCTACAAGCG GCTGGTCGGA 
GACCAGCGCG CCGGTGAGCT GATGGAGGCG CCCGCCTACG TCTGCTGGGG CCACAACAAC 
CGCTCGGCGC TCGTCCGGGT GCCGCTGTAC AAGCTCAACA AGTCCAACGC GGCCCGGGTC 
GAGTTCCGGT CGCCGGACAG CGCCTGCAAC CCGTACCTGA CCTTCGCGCT GATGCTCGCC 
GCCGGCCTGC GCGGGGTACA GGGCGGGTAC GACCTCCCGG CACCGGCGGC CGACGACGTG 
TGGACGCTGA CGGACGCGCA GCGCCGGGAG CGCGGCATCA CCGCGCTGCC CGGGTCCCTC 
GCCGAGGCGA TCGCGACCAT GGAGACGTCC TCGCTCGTCC GGGAGACCCT CGGCGACGAG 
CTGTTCGACT TCTTCCTGCG CAACAAGCGC TCGGAGTGGA TCGAGTACCG CAGGCAGGTC 
ACGCCGTTCG AGATCGACCG GTACCTCCCG ACCCTGTGA

Protein sequence

MDKQQEFVLR TLEERDIRFV RLWFTDVLGV LKSVEIAPAE LEGALAEGIG FDGSAIEGFA 
RVHEADMLAR PDPSTFQVLP WRGEHPMTAR MFCDLVMPDG TPAVADSRWV LRRTLARAAD 
AGFTFYTHPE IEFFLLKHPP TRGGPMPPPV DESGYFDLTP NDISHDFRQQ AIGVLERLGI 
SVEFSHHEVA PGQQEIDLRY ADALTIADNI MTFRQVVKEV ALRQGIYATF MPKPFSDQAG 
SGMHTHMSLF EGDRNAFHDP TDEYQLSKVA KAFIAGLLVH SAEITAVTNQ WVNSYKRLVG 
DQRAGELMEA PAYVCWGHNN RSALVRVPLY KLNKSNAARV EFRSPDSACN PYLTFALMLA 
AGLRGVQGGY DLPAPAADDV WTLTDAQRRE RGITALPGSL AEAIATMETS SLVRETLGDE 
LFDFFLRNKR SEWIEYRRQV TPFEIDRYLP TL