Gene Mlg_1758 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1758
Symbol
ID	4268818
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2012570
End bp	2014144
Gene Length	1575 bp
Protein Length	524 aa
Translation table	11
GC content	62%
IMG OID	638126516
Product	phage tail sheath protein
Protein accession	YP_742594
Protein GI	114320911
COG category	[R] General function prediction only
COG ID	[COG3497] Phage tail sheath protein FI
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.53821
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTCCT ATTTACACCC TGGGGTCTAT ATCGAGGAAA TACCCAGTGG TTCCAGGCCT 
ATTGACGCGG CAGGGACGTC CACCGCCGCT TTCATCGGCT ACACCACCCG GGGGCCGGTC 
GACGAACCGA CCTTCATCAC CAGTTGGGAA GACTACGAGA ACATCTTCGG GGGCATCCGC 
GAGGTAGAGG ACTCGGTTAG CGGTATTGAT TCGATGAAGA ATGCCAGGCT CGGCCAGGAG 
ATCGACACCC TCGGCCTGTC GGTGTTCGCC TATTTTCAGA ATGGCGGGGG CAAGGCCTAC 
ATCATCCGCA CCGCCAGTGA CACAAAGGTG GCCGACGGTG CACTGGAGGA CTCCGGCACC 
GACCTGATTG GGTTCGAGGC GGTCAATCCC GGAACCTGGG GCAACCGGCT GCGGGTCCGC 
CTCACAGCCA AGCCGGACGC CAGCGATTCC CGTTTCACCG TGGAGATCGG CCGCGGGGAT 
GGCGATGACT TCGTCGCCGA CGAGACTTTC ACCGACGTCT CGCTGGAGAA GGGGGATAAC 
GATTATCTCA CCACCGTCCT GAAGGAGGGC TCGGAGCTGC TAAGGGTCAG CGACGAGGAC 
GATATCGCCG ATGCGGTCGC GGTCATTAAC GCTGCCGGAA CGGACGGTGT CAGCGTGGAG 
ATGACCGGCG GCGAGGACGG GACACCCGGT GGCGCCAATG AATACACCGG TATCTTTTCG 
AAGCTTCTGA AATACCGGGA TATCAACATC ATTCTGCTGC CCGATCAGAC CTGGGGAGGC 
GCAGGGCAGG GGATCATTGA AAGCGCCATC AGTCATTGCG AGACCATGAA AAACCGCATG 
GTCATCTTCG ATCTGCCTCC CGGCCAGGAG CTGGAAAAAG AAAAGGACGT GACCGACCTG 
GCGCTGACCA CCTCGACGTA CGCGGCCACC TATTACCCCT GGGCGCTGGT CAGCAACCCG 
CACTACAACC CCGACACCAA CCCGGGCGCG GAACGGATGG TGCTGGCGCC GGCGGGCGGC 
TTTGCCGCAG GGCAGTGGGC ACGAACGGAC GGCCGTCGGG GGGTGTGGAA GGCCCCGGCG 
GGGGTTGAGA CGAACCTTCT GGGCATCAGA AAGCTGCTCT ACACGGTCGA GGACGCCGAG 
CAGCAGTACC TCAACCCGTT GGGTGTCAAC GCCCTGCGCC AGTTGCCCAA CTACGGATCG 
GTGATTTGGG GCTCGCGCAC GCGGGCCACC CGCGCCAACC CGGAGTGGCG CTACATCCCG 
GTGCGGCGCA CCGCCATTTT CATCGAGGAG AGCATCTTTC ACGGCATCCA TTGGGCGGTC 
TTCGAGCCGA ACGACCACCG CCTGTGGTCG GCCCTACGCA CGAATATCGA ATCCTTCCTG 
GGCGGGCTCC ACCGCTCGGG GGCCTTCCAG GGTGAGAAGG CCAGTGATGC CTACTTTGTG 
CGCTGCGGTC TCGGGCAGAC CATGCGCCAG GGCGATATTG ATCGCGGCCA GGTGATCGTC 
GAGGTGGGCT TTGCGCCGCT CAAGCCGGCG GAGTTCGTCA TCGTGCGCAT TCAGCAGAAA 
GTCGGCCAAC AGTAA

Protein sequence

MASYLHPGVY IEEIPSGSRP IDAAGTSTAA FIGYTTRGPV DEPTFITSWE DYENIFGGIR 
EVEDSVSGID SMKNARLGQE IDTLGLSVFA YFQNGGGKAY IIRTASDTKV ADGALEDSGT 
DLIGFEAVNP GTWGNRLRVR LTAKPDASDS RFTVEIGRGD GDDFVADETF TDVSLEKGDN 
DYLTTVLKEG SELLRVSDED DIADAVAVIN AAGTDGVSVE MTGGEDGTPG GANEYTGIFS 
KLLKYRDINI ILLPDQTWGG AGQGIIESAI SHCETMKNRM VIFDLPPGQE LEKEKDVTDL 
ALTTSTYAAT YYPWALVSNP HYNPDTNPGA ERMVLAPAGG FAAGQWARTD GRRGVWKAPA 
GVETNLLGIR KLLYTVEDAE QQYLNPLGVN ALRQLPNYGS VIWGSRTRAT RANPEWRYIP 
VRRTAIFIEE SIFHGIHWAV FEPNDHRLWS ALRTNIESFL GGLHRSGAFQ GEKASDAYFV 
RCGLGQTMRQ GDIDRGQVIV EVGFAPLKPA EFVIVRIQQK VGQQ