Gene Emin_0421 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0421
Symbol
ID	6262558
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	450068
End bp	451279
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	40%
IMG OID	642610889
Product	GntR family transcriptional regulator
Protein accession	YP_001875315
Protein GI	187250833
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.493071
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	79
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTAAATT ATTCAAATTT ATTTTCAGAA GTAACTAAAC GCACCAAAGC TTCAGTAATA 
AGAGAGCTTT TAAAACTTAC CGCCAAGCCT GAAATTATTT CTTTCGCGGG CGGATTGCCT 
GACCCTAAAG AATTTCCCGT TGAAGACGTT AAAAAAATGT TTGATATTAT TTTAAACAAA 
TATTCCTCCG CCGCTTTACA GTACGGCGCT ACTGAAGGCT GTGCTTCTTT AAAAACAGCT 
CTTTGCAAAT GGCTAAAAGA TGTTGAGGAT ATTGACGTTG CCGATAACCA GATGTTAATT 
ACATCAGCCT CACAGCAGGC GCTTGATATG GTAGCCAGGA TTTTTATTAA CCCCGGCGAC 
AGGATTATAG TTGCCACCCC GACATATTTA GGGGCGTTAC AGTCCTTTCA AACAGCGGGG 
GCCGATATTA AAGGCGCAGA TAGCGATGAT GACGGCGTAA TACCTGAAAG TTTGGAAAAA 
TGTTTGGAAC AAACCAAAGA GGAAGGCAAA CAGTGCAAAT TTGTTTACCT GGTGCCTGAT 
TTCCAAAATC CTACAGGGGT TACAATACCC CAGGAACGCA GGTTAAAAAT ATTAGAAACC 
GCTAAAAAAT ATAACACCGT AATTGTGGAA GATTCCCCTT ATAGACAGGT GCGTTTTGAA 
GGGGAAGCGC CAAAAACATT TTACAACCTT GATAAAGGGC AGGGTAATGT AATTACATTG 
TTTACTTTTT CAAAGATTTT TGTTCCCGGT TTCAGGTTAG GCTATATTAT CGCCAATGAG 
GAAGTTATAA GAAAGTTTGT GGTTTTAAAA CAGGCTATGG ATTTATGCTC ACCTTCAATA 
CTCCAGCTTG CCACGGCGGA ATATATTAAC GGCGGATATC TTGAAAAACA TATAAAAAGA 
GTTGTGGAAG TTTACAGAAA AAAAAGAACA GCCATGCTTG CCGCGCTTGA AAAATATATG 
CCCGAGGGGG TTAAATGGAC CCGTCCCGAA GGCGGTTTAT TCTTATGGGT AACATTGCCC 
AAATATTTAG ATACGGAAAA AATGTTCCCC AGCGCTATTG AAAATAATGT GGCGTATGTG 
GTTGGCTCGG CCTTTTACTA TGACGGCAAA ACCAAAAATG ATATGAGGCT TAATTTTTCT 
TACGCTACGC CTGAAGAAAT TGACGAAGGT ATTAAGCGTT TGGCCTTGGC TGTTAAAAAG 
AATCTTAAAT AA

Protein sequence

MLNYSNLFSE VTKRTKASVI RELLKLTAKP EIISFAGGLP DPKEFPVEDV KKMFDIILNK 
YSSAALQYGA TEGCASLKTA LCKWLKDVED IDVADNQMLI TSASQQALDM VARIFINPGD 
RIIVATPTYL GALQSFQTAG ADIKGADSDD DGVIPESLEK CLEQTKEEGK QCKFVYLVPD 
FQNPTGVTIP QERRLKILET AKKYNTVIVE DSPYRQVRFE GEAPKTFYNL DKGQGNVITL 
FTFSKIFVPG FRLGYIIANE EVIRKFVVLK QAMDLCSPSI LQLATAEYIN GGYLEKHIKR 
VVEVYRKKRT AMLAALEKYM PEGVKWTRPE GGLFLWVTLP KYLDTEKMFP SAIENNVAYV 
VGSAFYYDGK TKNDMRLNFS YATPEEIDEG IKRLALAVKK NLK