Gene Ent638_4055 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_4055
Symbol
ID	5110809
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	4408837
End bp	4409826
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	53%
IMG OID	640494280
Product	sulfate transporter subunit
Protein accession	YP_001178761
Protein GI	146313687
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1613] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.868359
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAAAT GGGGCGTGGG TTTAACGTTA TTGCTGGCAT CGACCAGCGT TCTGGCAAAA 
GACATCCAGT TACTGAACGT GTCGTACGAT CCGACGCGTG AACTGTACGA TCAATACAAC 
AAAGCGTTCG CGGCACACTA CAAGCAGGAG ACCGGCGATA ACGTGGTGAT TCGCCAATCG 
CATGGCGGCT CCGGTAAACA GGCTACCTCT GTCATTAACG GCATCGAAGC GGATGTGGTC 
ACCCTGGCGC TGGCCTATGA CGTAGACGCC ATCGCTGAGC GCGGTCGTAT TGATAAAAAC 
TGGATTAAAC GTCTGCCGGA CAATTCCGCG CCGTATACCT CCACCATCGT CTTCCTGGTG 
CGCAAAGGTA ATCCAAAACA AATTCATGAC TGGAACGATC TGATTAAACC GGGCGTTTCC 
GTGATCACCC CGAACCCGAA AAGCTCCGGC GGCGCACGCT GGAACTACCT GGCAGCCTGG 
GGCTACGCGC TGCACCATAA CAACGGTGAC CAGGCCAAAG CACAGGATTT CGTGAAGTCC 
CTGTTCAAAA ACGTCGAAGT GCTGGATTCC GGCGCGCGCG GCGCAACCAA TACCTTCGTA 
GAACGCGGCA TCGGTGACGT GCTGATTGCA TGGGAAAACG AAGCGCTGCT GGCAACCCAT 
GAACTGGACA AAGATAAGTT CGAAATTGTC ACCCCGAGCG AATCGATTCT GGCGGAACCG 
ACCGTTTCTA TCGTCGATAA AGTGGTTGAG AAAAAAGACA CCAAAGCGGT GGCCGAAGCC 
TATCTGAAGT ATCTCTACTC TCCAGAAGGC CAGGAAATCG CAGCGAAAAA CTTCTATCGT 
CCACGCGACC CGGAAGTAGC GAAGAAATAT GATAGCGCGT TCCCGAAACT GAAGCTGTTC 
ACCATTGACG AAGAGTTCGG CGGCTGGGCG AAAGCGCAGA AAGAGCACTT CTCTAACGGC 
GGCACGTTCG ACCAGATCAG CAAACGCTAA

Protein sequence

MNKWGVGLTL LLASTSVLAK DIQLLNVSYD PTRELYDQYN KAFAAHYKQE TGDNVVIRQS 
HGGSGKQATS VINGIEADVV TLALAYDVDA IAERGRIDKN WIKRLPDNSA PYTSTIVFLV 
RKGNPKQIHD WNDLIKPGVS VITPNPKSSG GARWNYLAAW GYALHHNNGD QAKAQDFVKS 
LFKNVEVLDS GARGATNTFV ERGIGDVLIA WENEALLATH ELDKDKFEIV TPSESILAEP 
TVSIVDKVVE KKDTKAVAEA YLKYLYSPEG QEIAAKNFYR PRDPEVAKKY DSAFPKLKLF 
TIDEEFGGWA KAQKEHFSNG GTFDQISKR