Gene Lferr_1780 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lferr_1780
Symbol
ID	6877762
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidithiobacillus ferrooxidans ATCC 53993
Kingdom	Bacteria
Replicon accession	NC_011206
Strand	-
Start bp	1760148
End bp	1761308
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	64%
IMG OID	642789648
Product	hopanoid biosynthesis associated glycosyl transferase protein HpnI
Protein accession	YP_002220208
Protein GI	198283887
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID	[TIGR03472] hopanoid biosynthesis associated glycosyl transferase protein HpnI

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGCTGGT GGATAGGCGG CCCTGCGGCC CTGCTTTCCC TGGCGGCCGT GGTCTATCTG 
CTGTTGGCGC TTCGAGCAAT CGCGCGCTGG CATCCGGTAT TGCCGGAGCG CGATGCCGCC 
GTCAGCGGAG ATATCCTGTG CGACGGGCCC GGGGTCAGTG TGCTCAAGCC CCTGCATGGG 
GACGAGGGGG ATCTCTACGC CGCCTTGCGC AGTTTCTGCG TGCAGGACTA CCCGGCATTT 
GAAATCGTTT TTGGCGTGCA GCGCCCCGAC GATCCTGCCG TCACCGTGGT GCAGCGGCTG 
CAGGCCGAGT TCCCGGCCCT GGCGTTGCGC TGGGTGTGTA CGGAAGCGCG TATCGGCAGT 
AATCCCAAGG TCAATAATCT GGCGGGTATC CTCGCGCTCT GTCGTTACGA CACCCTGGTG 
ATCAGCGACG CGGATATTTC CGTCGGCCCC CATTACTTGC GCCAGATCTG TGCTTCCCTG 
CAAAACAGGG ATGTGGGGGT GGTGACCTGC CTCTATCGGG CCAGGCCCGT AGCCACCTTC 
TGGTCGCGGG TGCTGGCCGG TCAGGTGAAC GGTCTCTTTC TGCCCTCGGT GCTGCTGGCG 
GCGCGCCTGG GTCCGAACAT TTTCTGCGGC GGGGCGACCA TGGCCCTGCG TCGCCCGACG 
CTGGCGGCCA TCGGCGGCCT GCCACGCCTG GCAAACCAAC TGGCTGACGA TTACTGGCTC 
GGCGCCTACA GCCGCCAGTT GGGGCAAGCC ACCCTGCTCG CGGATTATGT GGTGGACACC 
GAGGTCCGGG AGGCGAATTT CCGCGCCTTT TACCAGCATG CGCTGCGCTG GTCGCGTACC 
ACGCGATCGG TACAGCCGCT GGGCCACACC TTTTCCTTTT TGACTTATCC GCTGCCCCTG 
GTGCTGCTGC TCGCGCCCTG GATGGGTCTC TGGGGCGGGG TGCCGCTGGG TGTGGTTCTC 
CTCTTGCGCC TCGTGTACCA TAGGCAAATT ATGCACAAAC TTAGTGCAGA CGGTTCGTTT 
GGTGTGGCCC TGCTGGGAGA GTTTCTGGGC CTGTGGATCT GGTTTCACGC CCTTTTCGCA 
CGGCACGTTG CCTGGCGGGG GTCGCAATTT GCCATCGGCG CCGACGGGCG GATGGATGGC 
CATGACGGAG CAAAACGATG A

Protein sequence

MCWWIGGPAA LLSLAAVVYL LLALRAIARW HPVLPERDAA VSGDILCDGP GVSVLKPLHG 
DEGDLYAALR SFCVQDYPAF EIVFGVQRPD DPAVTVVQRL QAEFPALALR WVCTEARIGS 
NPKVNNLAGI LALCRYDTLV ISDADISVGP HYLRQICASL QNRDVGVVTC LYRARPVATF 
WSRVLAGQVN GLFLPSVLLA ARLGPNIFCG GATMALRRPT LAAIGGLPRL ANQLADDYWL 
GAYSRQLGQA TLLADYVVDT EVREANFRAF YQHALRWSRT TRSVQPLGHT FSFLTYPLPL 
VLLLAPWMGL WGGVPLGVVL LLRLVYHRQI MHKLSADGSF GVALLGEFLG LWIWFHALFA 
RHVAWRGSQF AIGADGRMDG HDGAKR