Gene A9601_04481 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_04481
Symbol
ID	4717146
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	388237
End bp	389394
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	34%
IMG OID	640078160
Product	putative glycosyl transferase, group 1
Protein accession	YP_001008843
Protein GI	123967985
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.680324
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGTTCATA TTGCCTGGTT GGGAAAAAAA TCCCCTTTTT GTGGAAATGT AACTTACGGT 
AATTCAACTA CTCAGGAATT AAAGGCCAGA GGGCATAAAA TTAGTTTTAT TCATTTCGAT 
AATCCCTCTA CTTCAAATTC ATCAAAACCA TTATTTCTTG CGAATGATCC TGATGTAAGT 
CTCCCATATT TAATTAAATC TCAAGTTTAT ACAATACCCT CGCCAAGGGC AGAAAAAGAG 
CTAAGGCTAT CATTGGAAAG ACTAAAGCCT GACATAGTAC ACGCAAGCCT AACTTTGTCT 
CCTTTAGACT TTAGACTGCC AGAGCTTTGT ACTAAAATTA ATGTTCCCCT TATAGGAACA 
TTTCATCCAC CATTTGATGC AAAAAATAGA AATCTAACTG CAAGCACGCA ACAATTAACG 
TATCAACTTT ATGCTCCATC CTTAGCAAAG TTCCATAAAA TAATTATTTT TTCTGAACCT 
CAAAAAAATG TTCTTGAGAA ATTAGGAGTA CCTAAAGAAA AACAAATAAT TATTCCAAAC 
GGAGTTGATG AAAATATTTG GAAACCTTTT TGCGAAAAAA GTAAAAAATA TAATCAGGTT 
AAAAACAAAC TTGGCAATGA AAGAATCTTT TTATACATGG GAAGGATTGC AAATGAAAAA 
AATATCGAGG CACTTTTACG TTCTTGGCGC CAAACAAGAA CTCAAAATTG CAAATTAGTT 
ATTGTTGGGG ATGGACCAAT GAAGCCAACA CTTGAAAATA GTTTTTCTAA CCTTGGTAAT 
GAGAAATTAA TTTGGTGGGG TGCCGAATTA GATTTAGAAA CTAGGGTAGC AATAATGCAA 
ATAGCAGAAG TATTTTTCTT GCCAAGCTTA GTAGAAGGTT TATCATTATC ACTTTTAGAG 
GCAATGTCGG CTGGTACTGC ATGCGTAGCT ACAGATGCCG GAGCGGATGG TGAAGTTTTA 
GATAACGGAG CAGGAATAGT AATTTCAACT GATAATGTGG CTGCACAATT AAAAACTATA 
ATCCCAATTC TTGTAGAACA CCCTTCATTT ACAAAAGATC TTGGCGAAAA AGCTAGAGAA 
CGTGTACTTG AGAGATACAC AATTACTAAA AATATAAATT CACTTGAAAA AGTTTATATG 
AACTTAAAAG ATAATTGA

Protein sequence

MVHIAWLGKK SPFCGNVTYG NSTTQELKAR GHKISFIHFD NPSTSNSSKP LFLANDPDVS 
LPYLIKSQVY TIPSPRAEKE LRLSLERLKP DIVHASLTLS PLDFRLPELC TKINVPLIGT 
FHPPFDAKNR NLTASTQQLT YQLYAPSLAK FHKIIIFSEP QKNVLEKLGV PKEKQIIIPN 
GVDENIWKPF CEKSKKYNQV KNKLGNERIF LYMGRIANEK NIEALLRSWR QTRTQNCKLV 
IVGDGPMKPT LENSFSNLGN EKLIWWGAEL DLETRVAIMQ IAEVFFLPSL VEGLSLSLLE 
AMSAGTACVA TDAGADGEVL DNGAGIVIST DNVAAQLKTI IPILVEHPSF TKDLGEKARE 
RVLERYTITK NINSLEKVYM NLKDN