Gene Haur_4812 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4812
Symbol
ID	5736657
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	6139949
End bp	6141037
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	50%
IMG OID	641281977
Product	hypothetical protein
Protein accession	YP_001547570
Protein GI	159901323
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0823] Periplasmic component of the Tol biopolymer transport system
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATCAGA TAGGTCGTCG AACAGTAACC AGTTTATCAG TAGGCTTGGT AGCGATCATA 
ATTTTGTTGG TCACGATTGG TCAACAACCC AGTGCAGGCC AAGTTGCTAA CAATACGCCA 
AATCAAGCTC AAGCCCAAGT TAGTGGTATT TTATTTTTGC GCAATCCCGC TCAGCAAGCT 
GAATTGTGGC GCTCGGATGC CAATGGTCAA GGGCAGCAAT TACTTGTACC GCAAGTTAGC 
GATTATAGCC TTAGCCCCGA TGGGCGCAAA GTTGCCTATG CAACTCAAGC CGAAGCCCAA 
CCAAGCCGGA TCGAAATGTT TGATCTGACC CAAAATCAGG TGATTACGAG CACAGGTTCG 
GCTGATTGGA CTGGTTACAC GCCGAATTGG TCGCCTGCTG ATGGCGTGAT TGTCTATGAA 
CGACGCACAA TTAGCACTGG CGGAGTTGGT TCGCCCAAAC TTTGGTTGAT GCAGCCCGAT 
GGAACACAAG TTAGTCCGGT GGTTAAAGGC GGCGATGTGG TTACCTTTGG TGCACATTGG 
TCGAATACTG GACGCTTGTT AGGCTTTACC GATCCATTGC GCAATGAATT GGTTTTATTT 
GATTTTAGCG ATGTGTTGCG GCGGATTCCA TTTAGCGGCG ATTTTGATTG GTCACCCGAT 
GATCAGCGTT TAGTAATTAG TGTGTTGCGG GAGTCGCAAG CAGGTTTTCG CAACGAATTA 
ATCCTATTTG ATCTGATGAC CGAGCAACAA ACACCCTTGA CTAGCCAAAC CGACACTGAT 
GATTTCACGC CCGTTTGGTC GCCTGATGGC ACAAAAATCG CCTTTGTGCG CCGCACCCGT 
GAAGTGCCTC GCGGCGAAAT TTGGGTGGTT AATGCTGATG GCAGCGAGCC ACGGGCAATT 
ACGGCGGGCG GCGGCTACGA TAACGTTGAT CCGCAATGGA CTCCCGATAG CCAACAATTG 
CTCTGGACGC GCTTGACCGT GGGTTCGGCA AACGTACCCT CGGCAATCTG GACGGTTAAT 
TTGGCTGAAA ATTCAGAGCC ACGGGTGTTG ATCGAAAATG CCACCCAAGC TCGTTGGATC 
GTTGAGTAG

Protein sequence

MDQIGRRTVT SLSVGLVAII ILLVTIGQQP SAGQVANNTP NQAQAQVSGI LFLRNPAQQA 
ELWRSDANGQ GQQLLVPQVS DYSLSPDGRK VAYATQAEAQ PSRIEMFDLT QNQVITSTGS 
ADWTGYTPNW SPADGVIVYE RRTISTGGVG SPKLWLMQPD GTQVSPVVKG GDVVTFGAHW 
SNTGRLLGFT DPLRNELVLF DFSDVLRRIP FSGDFDWSPD DQRLVISVLR ESQAGFRNEL 
ILFDLMTEQQ TPLTSQTDTD DFTPVWSPDG TKIAFVRRTR EVPRGEIWVV NADGSEPRAI 
TAGGGYDNVD PQWTPDSQQL LWTRLTVGSA NVPSAIWTVN LAENSEPRVL IENATQARWI 
VE