Gene P9211_00921 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_00921
Symbol	citT
ID	5730889
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	+
Start bp	97251
End bp	99080
Gene Length	1830 bp
Protein Length	609 aa
Translation table	11
GC content	41%
IMG OID	641284435
Product	DASS family sodium/sulfate transporter
Protein accession	YP_001549977
Protein GI	159902633
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0471] Di- and tricarboxylate transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGAGT TAATAGTGGT TTTAGAAAAC CCTCAGGCGC TAATAACTTT GGGAGTTTTG 
GTATTAGCAG TAGTGCTATT TATTAGTGGT TTGCTTGCAC CTGAATTAAC CGGTCTTTTA 
AGTGTGGCGT TGTTAATGGC TACAGGAGTC CTGTCACCTC ACAAGGCTTT ATCTGGTTTT 
GGTAGTCCAG CCTTGATAAC TTTAATGGGA TTGTTCGCTG TATCTGCAGC ACTATTTAAA 
AGTGGTGCGT TAGATAGATT GCGAGAATTT ATAGCTTCAG AAAGTATTAG AACTCCTCGT 
CGTTTAATTG CATTTTTAGG CTTTATTGTA GCTCCCATAT CAGGGATAGT TCCTAATACA 
CCTGTAGTTG CATCACTTTT ACCTGTGATA GAAGCTTGGT GTTTTAAACG CAAACTTTCC 
CCTTCCAGGG TATTACTACC TCTTTCCTTT GCAACAGTTT TAGGAGGCAC TCTTACTTTA 
TTAGGTAGCT CGGTGAATCT ATTGGTTAGT GATATAAGTC AGCAACTTGG GTATGGGTCT 
TTAGAATTAT TTAGTTTCAC TGCGATAGGT GTTCCAATTT GGCTGGTGGG GACAGCTTAT 
TTATTGTTAG CGCCTCAAAG ACTGTTGCCT GACCGAGGAA GAGATAATGG GGAATTTGGA 
GGTAGTGCAG ACCAGACGGG ATACTTCACT GAAGTGACTA TTCCCATAGA TTCAGATTTA 
GTTGGACAGT CTCTGCATAA CAGTAGATTG CAACGTCGAT TTGATGTTGA TGTTTTGGAG 
CTTCAAAGGG GAAAGGAAAG ATTGCTTCCC CCGCTCGCAG ATAGAACTAT TGAGCCTGGA 
GATAGATTAT TGCTTCGTGT GACTCGTGCA GATTTATTGC GTCTTCAGCA AGAACATACT 
GTTCAGTTGG CTAAACAGAA TTTTGTCAAT GCTTCAGAGG AGCAAGTGGA GCCGTTTTTA 
CGAGAAGGTC AAAAAACAGT TGAGGTTCTT CTTCCAGCAG GATCAACCTT GGCTGGTGCG 
AGTTTGAGAG AATTAAGATT TCGACAACGC CATAATGCAA CTGTCTTAGC TCTTAGGCGA 
GGACAGCAGA CTGTCCAAGA ACGTTTAGGT CAAGCAATTT TGCGAGAAGG AGATGTATTG 
CTTTTACAAG CTCCGATAGA TTCAATTCGT GGACTGCAGG CTAGTAATGA TTTGCTTGTC 
TTAGATCAAT TTGAAAATGA CTTGCCTACT ATCAGACGCA AGCCAATTAC CATTGGCATT 
GCTATTGCGA TGGTTCTCTT ACCTGCCCTT ACTTCCCTGC CATTAGTTGC ATCCGTTTTG 
ATAGCAATGA TTCTAATGGT TGTTAGTGGT TGTTTGCGCC CTGCAGAGGT GCAGAGTTCT 
ATACGTCTAG ATGTAATTCT CTTGCTGGGG TCTCTATCTA GTTTTAGTGT TGCGATGCAG 
GCGACAGGGT TAGCTGATGC TTTTGCTGCA ACTCTTGAGT ATTGGTTAAA GGGATTACCT 
ACATATTTTT CTTTACTAGT TGTTTTCTTT GCTACGACTA TAGTTACTCA GTTTATTAGT 
AATGCTGCTT CAGTAGCTTT ACTGGCACCA GTTGCAGTTC AGCTTGCTTC GGGAATGAAC 
TTACCTCCCA TGGCTCTTTT GATGACAGTT TTATTTGGCG CGAGTCAATC TTTTCTGACA 
CCTATGGGGT ACCAAACAAA TTTAATGGTT TTTGGCCCTG GTAGGTATCG TTTCCTTGAT 
GTGACTAGAT ATGGAGCTGG ATTGACTGCA TTAATGACTC TCATTGTTCC TTTATTAATT 
ATTTGGCAAT ACGGAGGAAC TTTTAGGTAA

Protein sequence

MDELIVVLEN PQALITLGVL VLAVVLFISG LLAPELTGLL SVALLMATGV LSPHKALSGF 
GSPALITLMG LFAVSAALFK SGALDRLREF IASESIRTPR RLIAFLGFIV APISGIVPNT 
PVVASLLPVI EAWCFKRKLS PSRVLLPLSF ATVLGGTLTL LGSSVNLLVS DISQQLGYGS 
LELFSFTAIG VPIWLVGTAY LLLAPQRLLP DRGRDNGEFG GSADQTGYFT EVTIPIDSDL 
VGQSLHNSRL QRRFDVDVLE LQRGKERLLP PLADRTIEPG DRLLLRVTRA DLLRLQQEHT 
VQLAKQNFVN ASEEQVEPFL REGQKTVEVL LPAGSTLAGA SLRELRFRQR HNATVLALRR 
GQQTVQERLG QAILREGDVL LLQAPIDSIR GLQASNDLLV LDQFENDLPT IRRKPITIGI 
AIAMVLLPAL TSLPLVASVL IAMILMVVSG CLRPAEVQSS IRLDVILLLG SLSSFSVAMQ 
ATGLADAFAA TLEYWLKGLP TYFSLLVVFF ATTIVTQFIS NAASVALLAP VAVQLASGMN 
LPPMALLMTV LFGASQSFLT PMGYQTNLMV FGPGRYRFLD VTRYGAGLTA LMTLIVPLLI 
IWQYGGTFR